V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coolloves  ›  全部回复第 35 页 / 共 37 页
回复总数  740
1 ... 27  28  29  30  31  32  33  34  35  36 ... 37  
2016-07-16 16:13:50 +08:00
回复了 tikazyq 创建的主题 Python 为爬虫构建代理池
我是这样做的,先找代理网站爬下代理,然后定义验证地址来验证是否有限,然后存取
在正式用的时候,遇到无效的就记录无效次数加 1 ,成功的也记录次数加 1 ,然后一段时间内根据成功失败记录来清理代理池,留下定义多少概率的代理,
2016-07-09 13:48:19 +08:00
回复了 nlimpid 创建的主题 Python 求助,为什么 Requests 不能获取到知乎的页面?
加个 headers 就可以了把
2016-07-07 13:12:02 +08:00
回复了 yangyaofei 创建的主题 程序员 上亿调数据检索,用什么可以提高效率
上 es 吧,以下是刚刚实测的,
111,130,586 hits 的数据,输入关键字也就几秒就检索完了.
三台 dell730 做成的集群
2016-06-23 17:55:29 +08:00
回复了 coolloves 创建的主题 问与答 请教一个 apache rewrite 规则.
一直用 nginx,有台老机器要跳转走,准备慢慢下了,发现真心不太会设置啊,请教请教,多谢大家
2016-06-23 17:54:53 +08:00
回复了 coolloves 创建的主题 问与答 请教一个 apache rewrite 规则.
请教下,^/$ 这个应该就是访问 www.a.com 这个根主页吧.
我发现就是这个规则不生效
请教下,如何设置当访问地址是 www.a.com/以外的都跳转走
2016-06-20 22:15:27 +08:00
回复了 chinajik 创建的主题 NGINX Nginx 配置的疑惑
我理解的是 /(.+)$=/$1,执行后,break 了,所以访问 google.com 就是正常的 google.com
如果注释了,就反代到 localhost 去了
2016-06-20 13:15:48 +08:00
回复了 wraith4 创建的主题 云计算 今天发现公司的阿里云服务被黑了,被安装了 yam 来挖矿
放出来参考下吧
2016-06-20 12:49:07 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
@zjb861107 我也是在网上随手复制了个例子,还没仔细看,是没闭合,不过不是这个问题,应该是我 yum 装了 python-lxml,又 pip install lxml 造成的,pip uninstall lxml 后可以了.
2016-06-20 12:42:43 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
我接触 python 时间不长,刚想卸载了重新弄,bs 是 setup.py 装的,不知道怎么卸载,看了下 pip install bs 有,pip install lxml 也有,就都 uninstall 了,结果,发现可以了.
我安装 bs 是下载了源码,python setup.py install 安装的,然后 yum install python-lxml,这样使用没问题

后来出问题后,我 pip uninstall bs ,pip uninstall lxml,
然后 pip install bs,成功,但是 pip install lxml 失败,此时,我发现可以正常工作了.


再次,请教下各位,这几种安装方式,有什么区别?
yum
pip
python setup.py install
2016-06-20 11:12:45 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
在线等.
2016-06-20 11:07:22 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
@liangmishi 谢谢回复
>>> soup = BeautifulSoup(html,"lxml")
>>> print soup

>>>
2016-06-19 10:06:31 +08:00
回复了 xiahei 创建的主题 Python Python 百度贴吧 签到
马克下!!!!
2016-06-17 21:07:14 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
@Kisesy 是的,我那样返回的是 str,刚学 python,多谢指点.
2016-06-17 21:06:22 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
我那个 rewrite 返回的是 str,不是 dict,所以 proxies 传入的类型错误了,我刚看了下 p 的类型是 str,不是 dict,多谢各位.
2016-06-17 20:59:27 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
@Kisesy
我的代理抓下来是 ip:port 格式保存的
我那个注释就是把代理改成{'http':'http://116.226.98.54:8118'} 格式
2016-06-17 20:57:18 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
我传入的是 dict 啊,所以我才比较纳闷
[root@localhost sh]# python httpreq.py
{'http':'http://116.226.98.54:8118'} 这个是我打印出来的 proxy
True
'str' object has no attribute 'get'
None
2016-06-14 21:46:26 +08:00
回复了 hippoboy 创建的主题 Python 求推荐几个爬取 js 生成的动态网页的教程?PhantomJS?其他?
马克
马克下,感谢分享
2016-06-10 09:11:59 +08:00
回复了 lovebeyondalways 创建的主题 Python 第一个 python 程序,抓取某网站表情包
和楼主情况差不多.
自己写了脚本抓取天气预报,天气预警,监控雪球,抓取什么值得买,然后入库.

还没有用到多线程,scrapy,其实自学这种东西能坚持下去就是胜利.与所有自学人共勉.
2016-06-03 12:45:41 +08:00
回复了 xummerj 创建的主题 Python 请教 pyspider 问题
同求!!!
1 ... 27  28  29  30  31  32  33  34  35  36 ... 37  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3012 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 12:59 · PVG 20:59 · LAX 05:59 · JFK 08:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.