首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
华为云
V2EX  ›  程序员

求问:这是用什么方式转换的图片站?

  •  
  •   manualplus · 2015-08-11 15:41:23 +08:00 · 1505 次点击
    这是一个创建于 1197 天前的主题,其中的信息可能已经有所发展或是发生改变。

    就这个http://oeeee.cc/qSUavR
    用什么东东做的?很想知道这是一种好方法还是一种折中办法?

    9 回复  |  直到 2015-08-14 08:23:59 +08:00
        1
    learnshare   2015-08-11 15:47:58 +08:00
    并不知道你在说什么
        2
    402645707   2015-08-11 15:49:17 +08:00 via Android
    爬虫爬的垃圾站
        3
    402645707   2015-08-11 15:49:56 +08:00 via Android
    好吧当我没说,
        4
    pango   2015-08-11 15:51:52 +08:00
    难道是ocr自动识别的?
        5
    Agromania   2015-08-11 15:55:35 +08:00
    这个大概是人工或自动去收集了很多说明书的pdf,转成图片,很不错的点子

    以PHP为例,pdf转图片很简单:

    <?php
    $im = new imagick('file.pdf[0]');
    $im->setImageFormat('jpg');
    header('Content-Type: image/jpeg');
    echo $im;
    ?>
        6
    pimin   2015-08-11 16:10:20 +08:00
    只是解析pdf吧
        7
    manualplus   2015-08-11 22:23:57 +08:00
    @Agromania 转成图片这个好理解,方法也很多,但它这个解析提取出文本内容(按页提取并自动加上超链接和做分行处理)思路很好。可能就是不知用什么方法和技术方案实现的?
        8
    paperpeper   2015-08-12 13:22:11 +08:00
        9
    manualplus   2015-08-14 08:23:59 +08:00 via Android
    @Agromania 点子很好吧,我们也在做说明书服务,欢迎交流
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3733 人在线   最高记录 3821   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 19ms · UTC 02:28 · PVG 10:28 · LAX 18:28 · JFK 21:28
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1