V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  zhurongx  ›  全部回复第 1 页 / 共 1 页
回复总数  2
2014-05-08 11:48:02 +08:00
回复了 lightforce 创建的主题 问与答 面对采集器,有什么好方法防止或者屏蔽采集的吗?
90%的情况下有效的方法:
把速度快,频率高,已经超出人类操作的频率的来源ip进行限制。监控ip访问流量、次数等特性的工具有很多。
剩余10%基本无解的方法:
好的爬虫会有一个ip池,会把请求分散在大量ip服务中转发,隐藏自己速度快频率高的特点,伪装成正常请求。这种情况下,除非你使用限制性逻辑,如积分满多少才可以打开,否则是无解的。
2014-05-05 15:56:59 +08:00
回复了 hyspace 创建的主题 分享创造 Gitblog.io - 简洁的 Github Pages 博客编辑器
卡在Checking if new repo is ready...了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2781 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 11:22 · PVG 19:22 · LAX 03:22 · JFK 06:22
Developed with CodeLauncher
♥ Do have faith in what you're doing.