需求简单来讲就是 [如何获取一个微信公众号的所有文章的链接] 。微信搜狗搜索早就跪了。现在还有办法实现吗?
求大佬们提供点思路,谢谢~
1
hunk 2020-10-23 22:30:24 +08:00 1
总之,很难。
研究过用真机自动化操作获取的方法,太麻烦了。 |
2
OldActorsSmile 2020-10-23 22:32:18 +08:00 1
xposed
|
3
wangyzj 2020-10-23 23:01:24 +08:00 via iPhone 1
逆向吧
|
4
opengps 2020-10-23 23:03:57 +08:00 1
缺少公开的索引入口,天然的防爬虫
|
5
lithbitren 2020-10-23 23:25:47 +08:00 1
主要把地址复制出来就好办了,闲置笔记本拿去做过些自用的挂机类小游戏的按键脚本,公众号没搞过但感觉比做小游戏的脚本还简单点,公众号聊天列表里按一次 page up/down 刚好是一屏,其他所有关键点的位置都是固定的,也不会误点广告,做脚本应该不太难,先拿完了地址再用别的东西爬就容易了
|
6
leverestfish OP 谢谢各位回复,太难了哈哈哈,看来我的水平就不用惦记真自动方法了 hhh
最后顺便不抱希望问问大家有没有见过这样需求的案例 /项目啊 |
7
IllBeBack 2020-10-24 02:18:27 +08:00 via Android 1
GitHub 有开源的 Python 代码,几个月前试过,模拟 Chrom 登入公众号后台,然后模拟插入别人的公众号文章链接到自己的文章。不过得到的是长连接。
|
8
heiheidewo 2020-10-24 09:04:02 +08:00 1
懒得抓啊,有现成的 api 接口卖嘛
|
9
locoz 2020-10-24 09:21:17 +08:00 via Android 1
量多大?量大还愿意花钱就很好解决
|
10
airqj 2020-10-24 09:37:03 +08:00 via Android 1
每个微信号每日请求公众号接口数量是有限制的
具体多少没注意 大概两三百 所以没法一次性拿到所有数据 |
11
Leigg 2020-10-24 10:43:08 +08:00 via Android 1
转换思维,你不行,有人行,高报酬求 xxx 爬虫源码,带文档,钱够了,没有找不到。所以说啊,典型的技术人思维,跳不出来。
|
12
Leigg 2020-10-24 10:44:08 +08:00 via Android
百度都查不到的东西,你指望会有人给你免费解答?
|
13
gochat 2020-10-24 11:39:33 +08:00 1
不麻烦,有买家嘛?
|
14
leverestfish OP |
15
gochat 2020-10-24 18:07:35 +08:00
@leverestfish 可以的,增量更新文章,同时抓取阅读量,评论,数据全部入库
|
16
leverestfish OP |
18
locoz 2020-10-24 22:19:53 +08:00 via Android 1
@leverestfish #14 量这么少你直接爬西瓜数据、二十次幂之类的就好了
|
19
kingba 2020-10-25 15:13:33 +08:00 1
[Chrome 插件让微信公众号历史文章阅读不再痛苦,在 PC /Mac Chrome 浏览器上就能看,而且支持文章列表导出 CSV (开源) - V2EX]( https://www.v2ex.com/t/692681)
自荐一下 |
20
leverestfish OP @kingba 已经失效了诶,打开历史页面看不到任何文章。
|
21
leverestfish OP @locoz 我需要特定公众号,这两个网站不一定有吧。
|
22
locoz 2020-10-27 16:48:14 +08:00
@leverestfish #21 没有的就添加监控啊,让别人帮你爬就好了
|
23
kingba 2020-10-28 22:18:23 +08:00
@leverestfish 可以参考下 github 上的 readme 说明哈,我试了下在 Windows 下是可以的,但你如果需要增量爬可能就不适合了。
|