https://github.com/zorlan/skycaiji
用 tp5 写的 php 版本采集器,使用上和 cms 系统类似
功能: 全自动定时定量采集
支持正则表达式、xpath、json 匹配数据
支持多级、多页、分页采集
可以将数据发布到 cms 程序、数据库、excel 文件等
配合谷歌浏览器实现页面渲染功能
图片本地化、ip 代理等等
1
glouhao 2019-02-19 20:15:50 +08:00 via Android
膜拜大佬
|
2
DonnyChao 2019-02-19 20:52:53 +08:00
在 vps 上安装试了一下,挺好用的,感谢作者开源,学习一下,github 已 star。
|
3
zqjilove 2019-02-19 21:07:23 +08:00
早期用过一次,感觉体验很不好,至少和之前用过的一些采集工具比,感觉还是操作体验差一些。功能没问题。还是 DXC 用的爽,可惜现在也收费了
|
6
d5n 2019-02-19 21:51:50 +08:00 via iPhone
收藏
|
7
vus520 2019-02-19 22:21:12 +08:00
已经 600 个星星了
|
8
lunatic5 2019-02-20 08:28:01 +08:00
蓝天采集器,刚出来的时候用过,感觉很赞。。。不过好像在 v2 推过好几次了
|
9
tdwj12580 2019-02-20 10:11:48 +08:00
可以的,我也收藏一下,以后有用再使用!
|
10
dany813 2019-02-20 10:20:06 +08:00
膜拜大佬
|
11
bzj 2019-02-20 10:23:52 +08:00
有没有演示站点
|
12
pinerge 2019-02-20 10:41:31 +08:00
采集一般都是 cli 吧,fpm 采集不是特别友好,就算把 php.ini 中 max_execute_time 设为无限有时进程也会莫名其妙的挂掉
|
15
runningman 2019-02-20 21:06:01 +08:00 via iPhone
关注一下 看看
|
16
willywu001 2019-02-28 14:57:38 +08:00
cookie 怎么设置的?
|
17
willywu001 2019-02-28 14:58:12 +08:00
@zorlan cookie 怎么设置呢,文档中没看到
|
18
zorlan OP @willywu001 任务》采集器设置》请求头信息 里面
|
19
dwhzy 2019-03-15 12:56:48 +08:00
mark 一下,好工具~
|