V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Fizzyi
V2EX  ›  Python

求用 Python 将 swf 格式的文件专成 pdf 或者图片的方法

  •  
  •   Fizzyi · 2021-01-26 18:03:41 +08:00 · 2379 次点击
    这是一个创建于 1403 天前的主题,其中的信息可能已经有所发展或是发生改变。
    swf 格式打开就是类似于 pdf 的,该网站是将 pdf 编译成了 swf 文件进行了展示,现在的需求是提取出里面的内容,现在的想法是先转成 pdf 或者图片 然后在提取里面的文字
    9 条回复    2021-01-27 10:58:45 +08:00
    renmu123
        1
    renmu123  
       2021-01-26 19:23:49 +08:00 via Android
    swf 是 flash 的后缀名,我之前有段时间搞了好久,翻遍了各个语言都是没有找到类似的工具的,如果楼主找到了艾特我一下。原因可能是由于 flash 是个闭源的工具,因此没办法解析
    kikikiabc
        2
    kikikiabc  
       2021-01-26 19:32:07 +08:00 via iPhone
    自动截屏
    Pagliacii
        3
    Pagliacii  
       2021-01-26 19:54:13 +08:00
    之前写个一个解析 SWF 文件头的,你可以看看 SWF 文件格式规范,然后自己写个转换器

    https://gist.github.com/Pagliacii/1bbb3953c6a7a8ed61f89e97d0ecf4a9
    unnamedhao
        4
    unnamedhao  
       2021-01-26 22:44:22 +08:00 via iPhone
    swf 文件格式是开放的,可以导出图片,https://www.adobe.com/content/dam/acom/en/devnet/pdf/swf-file-format-spec.pdf
    github 上应该也有 py 的解析库

    https://github.com/timknip/pyswf
    Fizzyi
        5
    Fizzyi  
    OP
       2021-01-26 22:51:53 +08:00
    @unnamedhao 第二个 pyswf 我也看了,但是似乎不支持 python3
    pckillers
        6
    pckillers  
       2021-01-27 09:28:20 +08:00 via iPhone
    建议录制自动化操作+截屏+ocr 。
    Fizzyi
        7
    Fizzyi  
    OP
       2021-01-27 09:45:48 +08:00
    @pckillers 现在的想法是获取到了 swf 文件,然后用 html 渲染出来截图然后 OCR 处理
    Gloomyer
        8
    Gloomyer  
       2021-01-27 10:50:22 +08:00
    ffmpeg 啊?
    julyclyde
        9
    julyclyde  
       2021-01-27 10:58:45 +08:00
    猜测是一个 swf 做的 pdf reader
    建议监听一下网络,看是不是有下载动作
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1254 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 18:11 · PVG 02:11 · LAX 10:11 · JFK 13:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.