V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yiqunz
V2EX  ›  Java

Java ITEXT 对 pdf 文本部分文本进行隐藏处理求助

  •  
  •   yiqunz · 2021-11-09 11:58:48 +08:00 · 1194 次点击
    这是一个创建于 870 天前的主题,其中的信息可能已经有所发展或是发生改变。

    JAVA ITEXT 对 pdf 文本进行处理

    需求:隐藏敏感数据,比如把 pdf 里的电话号码删除

    问题点:目前使用白色遮挡层去实现,生成的 pdf 表面是去除了电话号码。 但是在空白区域里还是能将电话号码复制出来。

            PdfContentByte canvas = pdfStamper.getOverContent(1);
            canvas.saveState();
            //白色遮挡层
            canvas.setColorFill(BaseColor.WHITE);
    

    不知道各位大佬有什么其他的实现方式处理

    9 条回复    2021-11-11 10:11:59 +08:00
    wowo243
        1
    wowo243  
       2021-11-09 12:02:51 +08:00
    为啥不直接删除,还覆盖一层
    yiqunz
        2
    yiqunz  
    OP
       2021-11-09 14:07:48 +08:00
    @wowo243 怎么删?
    yinzhili
        3
    yinzhili  
       2021-11-09 14:10:10 +08:00
    如果是自己生成的 PDF ,在生成之前就抹掉敏感数据是最简单的
    yiqunz
        4
    yiqunz  
    OP
       2021-11-09 14:24:04 +08:00
    @yinzhili 这。。我当然知道,处理别人上传的 pdf 。。
    buliugu
        5
    buliugu  
       2021-11-09 20:08:49 +08:00
    读取之后处理敏感信息然后直接重新生成一份新的 pdf
    yiqunz
        6
    yiqunz  
    OP
       2021-11-10 10:48:05 +08:00
    @buliugu 具体怎么处理呢?有参考的博客或者用到的技术么?难点在于我没找到这样做的方法。。。
    Jh1n
        7
    Jh1n  
       2021-11-10 10:55:48 +08:00
    覆盖然后写入新的内容比如空字符串
    yiqunz
        8
    yiqunz  
    OP
       2021-11-10 11:00:25 +08:00
    @Jh1n 没有用的。。贴图片盖住都不行,还是能复制。。能搜索出来
    buliugu
        9
    buliugu  
       2021-11-11 10:11:59 +08:00
    @yiqunz 有个 PdfCopy 类可以看一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5897 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 02:15 · PVG 10:15 · LAX 19:15 · JFK 22:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.