V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
sdielpf
V2EX  ›  Java

有没有解析 word 文档为结构化数据的工具

  •  
  •   sdielpf · Oct 20, 2022 · 2433 views
    This topic created in 1296 days ago, the information mentioned may be changed or developed.

    如题,我这里有一堆 word 文档,内容会按标题格式或者序号的形势来排列,有没有工具能够将这些内容结构化出来存到数据库中呢?

    2 replies    2022-10-21 13:20:15 +08:00
    akagishigeru
        1
    akagishigeru  
       Oct 20, 2022 via iPhone
    如果只是文字的话,可以解析成 xml 处理
    damai0419
        2
    damai0419  
       Oct 21, 2022
    刚做的需求。
    我们是解析 word 试卷,里面还包含图片公式之类的。
    word --> html ,然后解 html 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1253 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 17:36 · PVG 01:36 · LAX 10:36 · JFK 13:36
    ♥ Do have faith in what you're doing.