moskize 最近的时间轴更新
moskize

moskize

V2EX 第 236350 号会员,加入于 2017-06-20 16:51:05 +08:00
今日活跃度排名 24485
moskize 最近回复了
@zizek 没错,现在会多此一举做这个动作。这里是一个优化点,等于要允许跳过 OCR 截断直接进入分析阶段。calibre 估计没有做合并段落操作。这个用算法很难准确识别,毕竟 PDF 本身是没有这个信息的。pdf-craft 完全是让 LLM 来判断句子到底有没有被切断,然后拼起来。
@x4gz 下一步考虑做多线程
@sunnysab 这种想想都难识别😂 我看看公式识别相关 AI 能不能抓到这种,不过估计够呛
@3085570450tt 看介绍它们好像是为 LLM 提取文本,而不是用 LLM 处理文本。而且 PyMuPDF 我记得是不提供 OCR 的。
@bfdh 这个你在本地新建一个空文件夹,然后把地址传进去。这个文件夹里会在第一次下载模型,你就留着这个文件夹,下次运行就不会下载模型了。
@sunnysab 有识别公式的方案,不过第一版先用图形作为占位符,接下来准备支持公式识别。
@kitty7030 反过来转化相对好做,不过我暂时不太明白这么做的应用场景有哪些?
2022-08-25 10:59:31 +08:00
回复了 liuser666 创建的主题 IPFS IPFS 技术有人了解吗?
@Sasasu 其实我感觉传统存储和 IPFS 不是对立关系。比如,如果说当下 IPFS 市场能容忍比传统存储更贵的存储和分发费用,那为什么传统存储不直接去做矿工呢?还是说,现在传统存储已经偷偷在做矿工了呢?
2022-03-30 13:54:16 +08:00
回复了 PPP1G 创建的主题 Edge 被 Edge 的划词自动弹出菜单搞疯了
在设置中搜索「选择文本时显示你迷菜单」,关掉就行了。
2022-01-27 13:05:45 +08:00
回复了 fromzero 创建的主题 职场话题 一面的大头兵(非 leader)问我当前薪资和期望薪资
@xiao109 两个世界。一个世界人人不知道别人薪酬,在面试谈薪和谈涨薪的时候,两眼一抹黑。另一个世界,薪酬透明,这个公司拿多少钱,大家都知道,公司不同职级拿多少钱也知道。猜一猜这两个世界,哪个世界的资本家更狠。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3141 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 10:48 · PVG 18:48 · LAX 03:48 · JFK 06:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.