1
iyiluo 2023-06-01 10:40:06 +08:00
有很多第三方 pdf 解析工具,直接调用就行,固定格式固定位置的文件很好解析。java 有免费的 pdfBox 和收费的 itext
|
2
hhjswf 2023-06-01 10:46:07 +08:00
做过类似的,感觉挺傻 X,不知道什么人拍脑袋想出来的
|
3
LouchardBillyham OP @iyiluo 问题在于非固定非结构文件,如发票这种固定的文件我就不会来问了
|
4
rzdCG 2023-06-01 10:59:15 +08:00
spire.pdf
|
5
ZhuGeQing 2023-06-01 14:05:09 +08:00 via iPhone
都表格了,肯定是固定格式了,但是依然需要自己去清洗数据,可以从 pdf 的“源码”入手,筛选出所有的表格,判断表格是否是自己要的,如果是,那么就能根据行列标记拿到数据了
|
6
zbatman 2023-06-01 14:25:02 +08:00
|
7
LouchardBillyham OP @zbatman 这个确实牛,比 chatpdf.com 牛,能 98%实现我的需求
|
8
hkiJava 2023-10-13 17:19:24 +08:00
@LouchardBillyham 想问一下 op 怎么生成 kv 啊 上面发的没法生成
|