V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sanwenshi
V2EX  ›  问与答

如何对知乎内容进行爬虫?

  •  
  •   sanwenshi · 2016-05-30 17:45:50 +08:00 · 1781 次点击
    这是一个创建于 3131 天前的主题,其中的信息可能已经有所发展或是发生改变。

    知乎上有不少答案和分享是很值得一看的,那么如何能够爬取采集内容呢。

    这里有一种很简单的方法和大家分享下:使用现有的已经写好的爬虫。

    神箭手云爬虫上就有现成的知乎采集规则,使用方法也很简单。

    注册账号-获取规则-建立任务-启动任务,就可以爬取了。

    这个爬虫写的很详细,除了回答,还爬取了作者,头像,发布时间,内容的评论等。

    神箭手云爬虫链接: http://www.shenjianshou.cn/

    知乎的爬虫: http://www.shenjianshou.cn/index.php?r=market/configDetail&pid=20

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1030 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 20:15 · PVG 04:15 · LAX 12:15 · JFK 15:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.