V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
2232588429
V2EX  ›  Python

新手想请教一下,想用 python 在服务器上搭建一个爬虫页面来爬取指定网站的新闻资讯,这个在网上有哪些比较合适的教程可以参考的?谢谢!

  •  
  •   2232588429 · 2014-09-30 15:28:02 +08:00 · 4783 次点击
    这是一个创建于 3741 天前的主题,其中的信息可能已经有所发展或是发生改变。
    以前使用过这样的页面,就是按照时间刷新新闻标题列表,然后点击标题就可以进入别人的网站阅读内容。想请大家帮忙推荐一下这方面比较合适的教程。
    5 条回复    2014-10-02 22:01:02 +08:00
    zxcsf
        1
    zxcsf  
       2014-09-30 16:24:37 +08:00   ❤️ 1
    fxbird
        2
    fxbird  
       2014-09-30 20:13:56 +08:00
    这玩意儿居然都出中文文档了,很强么?
    orzfly
        3
    orzfly  
       2014-09-30 20:38:22 +08:00
    pyspider 也是个好东西 =。=
    https://github.com/binux/pyspider
    brickgao
        4
    brickgao  
       2014-10-02 12:01:16 +08:00
    处理新闻有一个叫 newspaper 的包

    http://newspaper.readthedocs.org/en/latest/
    GeekGao
        5
    GeekGao  
       2014-10-02 22:01:02 +08:00
    scrapy 足以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2464 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 01:12 · PVG 09:12 · LAX 17:12 · JFK 20:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.