• 请不要在回答技术问题时复制粘贴 AI 生成的内容
manualplus
V2EX  ›  程序员

求问:这是用什么方式转换的图片站?

  •  
  •   manualplus · Aug 11, 2015 · 3351 views
    This topic created in 3929 days ago, the information mentioned may be changed or developed.

    就这个http://oeeee.cc/qSUavR
    用什么东东做的?很想知道这是一种好方法还是一种折中办法?

    9 replies    2015-08-14 08:23:59 +08:00
    learnshare
        1
    learnshare  
       Aug 11, 2015
    并不知道你在说什么
    402645707
        2
    402645707  
       Aug 11, 2015 via Android
    爬虫爬的垃圾站
    402645707
        3
    402645707  
       Aug 11, 2015 via Android
    好吧当我没说,
    pango
        4
    pango  
       Aug 11, 2015
    难道是ocr自动识别的?
    Agromania
        5
    Agromania  
       Aug 11, 2015
    这个大概是人工或自动去收集了很多说明书的pdf,转成图片,很不错的点子

    以PHP为例,pdf转图片很简单:

    <?php
    $im = new imagick('file.pdf[0]');
    $im->setImageFormat('jpg');
    header('Content-Type: image/jpeg');
    echo $im;
    ?>
    pimin
        6
    pimin  
       Aug 11, 2015
    只是解析pdf吧
    manualplus
        7
    manualplus  
    OP
       Aug 11, 2015
    @Agromania 转成图片这个好理解,方法也很多,但它这个解析提取出文本内容(按页提取并自动加上超链接和做分行处理)思路很好。可能就是不知用什么方法和技术方案实现的?
    paperpeper
        8
    paperpeper  
       Aug 12, 2015
    manualplus
        9
    manualplus  
    OP
       Aug 14, 2015 via Android
    @Agromania 点子很好吧,我们也在做说明书服务,欢迎交流
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5472 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 56ms · UTC 08:56 · PVG 16:56 · LAX 01:56 · JFK 04:56
    ♥ Do have faith in what you're doing.