V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
imn1
V2EX  ›  问与答

有没有从图片(照片)OCR 文字的免费工具?

  •  
  •   imn1 · 2021-06-30 16:52:12 +08:00 · 2325 次点击
    这是一个创建于 1023 天前的主题,其中的信息可能已经有所发展或是发生改变。
    图片是照片,不是单一底色+文字的图片
    需要 OCR 的文字,只针对后期添加的比较印刷体文字(例如字幕、配图说明之类),不是原照片中原有的内容
    也就是不考虑原图中那些招牌、路牌之类直接拍摄的文字

    汉字+英文为主,能扩展到日韩更好

    主要不知道怎么搜,自己搜到的都是纸张扫描后 OCR 的工具,是针对底色单一的图片
    win/linux
    19 条回复    2021-07-01 16:23:08 +08:00
    Godykc
        1
    Godykc  
       2021-06-30 17:04:01 +08:00   ❤️ 1
    Tim 就可以,识别率还行


    Hardrain
        2
    Hardrain  
       2021-06-30 17:05:49 +08:00   ❤️ 1
    "只针对后期添加的比较印刷体文字(例如字幕、配图说明之类),不是原照片中原有的内容
    也就是不考虑原图中那些招牌、路牌之类直接拍摄的文字" 是什么意思? 给个 sample?

    这类照片里的文字处理一下(降低色彩空间,设置黑场 /白场)后用 tesseract 就行了
    MakeItGreat
        3
    MakeItGreat  
       2021-06-30 17:12:58 +08:00 via Android   ❤️ 1
    Onenote 可以,但是你这个量估计太大了
    买 Abbyy 的授权吧
    xingshu1990
        4
    xingshu1990  
       2021-06-30 17:16:05 +08:00   ❤️ 1
    @MakeItGreat #3 ABBYY+1 不过中文的要训练,而且好像也不便宜。
    xingshu1990
        5
    xingshu1990  
       2021-06-30 17:20:10 +08:00   ❤️ 1
    数量少的话 用天若 OCR (用的是百度 OCR 的 API )
    xgfan
        6
    xgfan  
       2021-06-30 17:35:12 +08:00   ❤️ 1
    百度云和腾讯云都有免费的 API 额度,自己写个工具调用一下就成了。
    imn1
        7
    imn1  
    OP
       2021-06-30 17:35:59 +08:00
    @Hardrain #2
    简单例子就如#1 的截图,或者表情包的文字,又或者一些彩印宣传单,背景是一幅图
    意思就是需要一个从图片抠出文字(分离)的步骤,一般 OCR 不做这事
    Wolfsin
        8
    Wolfsin  
       2021-06-30 17:39:15 +08:00   ❤️ 1
    讯飞 OCR 的 API,有专门针对印刷体和多语种的选项,目前用下来是最舒服的,新用户有 90 天 10 万的免费服务量其实很合适你短时间大量使用。
    https://www.xfyun.cn/service/textRecg
    或者直接用他们家的网页版本,每天免费 50 次
    https://saas.xfyun.cn/ocr
    DL9412
        9
    DL9412  
       2021-06-30 17:39:59 +08:00   ❤️ 1
    百度的高精度挺准的,但是免费额度少
    gainsurier
        10
    gainsurier  
       2021-06-30 18:20:40 +08:00 via iPhone   ❤️ 1
    你这个老马系列的工具能否有效解决你的需求
    hgc81538
        11
    hgc81538  
       2021-06-30 18:27:51 +08:00   ❤️ 1
    試下 https://ocr.space/
    princelai
        12
    princelai  
       2021-06-30 18:37:46 +08:00   ❤️ 1
    API 上面说的差不多了,自己部署的话 easyOCR 和 PaddleOCR
    dingwen07
        13
    dingwen07  
       2021-06-30 18:45:29 +08:00 via Android   ❤️ 1
    iOS 15 ?
    要专业就 Abbyy
    secretman
        14
    secretman  
       2021-06-30 18:46:44 +08:00   ❤️ 1
    桌面版 QQ 识别不错
    tinkerer
        15
    tinkerer  
       2021-06-30 20:33:37 +08:00   ❤️ 1
    emonc
        16
    emonc  
       2021-06-30 21:26:33 +08:00   ❤️ 1
    试试 https://github.com/JaidedAI/EasyOCR ?不过没有 CUDA 的话跑起来会很慢,识别率还行
    WildCat
        17
    WildCat  
       2021-06-30 21:41:29 +08:00   ❤️ 1
    miaomiao888
        18
    miaomiao888  
       2021-07-01 04:57:33 +08:00
    gitee.com/DDDDDGOOO/PandaOCR.Pro
    接口是蛮多的,可以自行尝试哪些符合你的使用场景,支持中日英繁,不支持韩文

    “意思就是需要一个从图片抠出文字(分离)的步骤,一般 OCR 不做这事”你这话应该不对吧,OCR 不就是干这事的,只不过多数 OCR 对印刷体支持较好,也有不少支持比较复杂的手写体识别,合合 OCR 可能是目前识别精度最高的 OCR,也许适合你。
    kocdko
        19
    kocdko  
       2021-07-01 16:23:08 +08:00
    扫描汪 APP
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5163 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 09:33 · PVG 17:33 · LAX 02:33 · JFK 05:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.