V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  studyaa  ›  全部回复第 1 页 / 共 1 页
回复总数  6
2019-07-08 16:24:36 +08:00
回复了 studyaa 创建的主题 问与答 请教一下 scrapy 爬取数据不完整的问题
@qianyin123 json.decoder.JSONDecodeError: Unterminated string starting at: line 1 column 13042 (char 13041)就这个错啊 json 数据不完整导致的
2019-01-11 12:29:12 +08:00
回复了 studyaa 创建的主题 问与答 请教一下关于 jTessBoxEditor 训练字体的问题
@ljspython 不会啊==大兄弟有没有例子啥的发个链接
@ToT 嗯嗯! 我看看
@summerwar 每天需要大概五六个小时跑几千万数据, 会用到 selenium
服务器的配置也跟所需代理 ip 有关吗?
对服务器不太懂
为什么都需要在服务器上跑爬虫

感谢之前的回答!
@msg7086
五六个小时要跑几千万数据,
ip 肯定要频繁换,多少个的话我也不太清楚怎么算,一个首页面一个?几十万个?
分布式不太懂
国外的不需要
价钱的话公司没说,就说做下来所需要的配置..

还有感谢回答!
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1165 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 23:49 · PVG 07:49 · LAX 15:49 · JFK 18:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.