V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  tikazyq  ›  全部回复第 31 页 / 共 43 页
回复总数  856
1 ... 27  28  29  30  31  32  33  34  35  36 ... 43  
2020-02-08 21:57:55 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@yoshiyuki 确实有表述问题,看来有些误导的意思,认为裤子都脱了,你就给我看这个的样子
2020-02-08 21:56:06 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@ooops 确实,下次要在摘要中把思路也说了
2020-02-08 21:55:10 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@locoz 明天空了看看😁
2020-02-08 21:44:25 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@i0error 即使如此,我估计看完文章的也没几个
2020-02-08 21:19:15 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@jziwenchen 确实打码平台是一种办法
2020-02-08 21:14:13 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@AX5N 对于懂的人来说可能都不用说,不懂的人需要大量篇幅
2020-02-08 21:13:06 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@whoami9894 对这种评论我也只有 no comment 😷
2020-02-08 19:21:38 +08:00
回复了 yangva 创建的主题 程序员 各位 V2EX 的大神,爬虫抓取有 ssl 检测的 app 数据怎么搞
爬虫写的好,监狱进得早
2020-02-08 19:20:41 +08:00
回复了 masker 创建的主题 程序员 Jetbrins all products pack 是否值得购买?
开源项目,免费用
2020-02-08 19:16:06 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@ipwx 这里的运营成本我理解的是管理爬虫的维护成本。如果是暴力破解验证码,算法一换立马凉凉。相反,如果是采用绕开的方式就可以有效绕开登录,何乐而不为呢,我觉得这是目前为止最简单花费最小的方式。咱们程序员都懒人,既然这样,为什么要亲自造火箭呢?
2020-02-08 19:08:03 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@t6attack 哪里写了自动登录这几个字的?
2020-02-08 18:50:54 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@matsuijurina 可爱在哪一点?;)
2020-02-08 18:50:19 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@zhw2590582 请尝试小学生写作试试
2020-02-08 18:50:01 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@godoway 为啥答非所问?
2020-02-08 18:49:36 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
一回来看到这么多评论,而且很多都是比较倾向于这种办法过于简单,不足挂齿的。这里我简单说明一下。

我写这篇文章的目的,不是为了把一个很简单的东西说得有多么高大上,而是将一个我的实际的产品例子拿来分享。这里再安利一下用到了这个技术的 Github 项目 ArtiPub,用的人也不是非常多,现在也只有 1.6k Github Stars,但在实战中确实有效,方法非常简单,而且竞争对手 OpenWrite 也是用这种方式来绕开登录的。其中所有平台 掘金、SF、v2ex、CSDN、开源中国、博客园、知乎、今日头条,都被这种方法绕开了,都是用 Cookie 的方式!不知道有不有相关的大佬会看到这篇文章回去升级登录验证方式的,例如用 JWT。

https://github.com/crawlab-team/artipub

我看了一下数据,文章阅读量到目前只有 65 个,也就是说 1.3k 从 v2 点进来的人,有多少人是真正看了文章而评论的呢?如果只是为了娱乐,我可以当然一笑了之,如果是被没看懂的大佬们误导,就有点得不偿失了。
2020-02-08 18:38:08 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@finely 既然这种方式有效,你是不是后悔没提前备着呢
2020-02-08 14:59:03 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@1018ji 到底是有用还是没用…
2020-02-08 14:58:04 +08:00
回复了 tikazyq 创建的主题 程序员 对于爬虫来说,一种绕开验证码登录的好办法
@rekulas 有啥问题?
2020-02-07 10:25:42 +08:00
回复了 black11black 创建的主题 Python Python , Github 上传仓库的代码有办法自动同步到 pypi 吗 ?
actions
2020-02-04 16:54:07 +08:00
回复了 tikazyq 创建的主题 程序员 爬虫管理平台 Crawlab v0.4.5 发布
@musi 是的,这个本身就是支持分布式的平台,可以多节点部署。Crawlab 分主节点工作节点,主节点主要控制 API 和节点注册等,工作节点主要负责抓取,你可以让主节点在内网,工作节点在外网,这样就可以实现你想要做的事情了。
1 ... 27  28  29  30  31  32  33  34  35  36 ... 43  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3510 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 00:40 · PVG 08:40 · LAX 17:40 · JFK 20:40
Developed with CodeLauncher
♥ Do have faith in what you're doing.