这类爬虫应该很简单,但是有妹有 编译好的工具啊? 直接填 tag 名字,咔咔导出书单 list 。
然后配合 jdownloader 高级脚本, (
https://my.jdownloader.org/index.html)
去解析 (
http://v1248.com/index.htm?kw=学习正则表达式) 里有效的 baiduyun 的 link
希望有高人能研究一蛤。
比如 这类不硬的书
[互联网](
https://book.douban.com/tag/互联网)
[个人管理](
https://book.douban.com/tag/个人管理)
[科技](
https://book.douban.com/tag/科技)
Ps : it 、不硬的编程、网络攻防、自我管理方面的 epub , txt 很少的(不过千),因为义务 ocr 校对几乎不可能
欢迎留言推荐 [软] 书,我可以用 abbyy 来 ocr 为 epub 、 txt 或者双层 pdf (我并不校对,有的书不校对也妹关系)