
https://github.com/zorlan/skycaiji
用 tp5 写的 php 版本采集器,使用上和 cms 系统类似
功能: 全自动定时定量采集
支持正则表达式、xpath、json 匹配数据
支持多级、多页、分页采集
可以将数据发布到 cms 程序、据库、excel 文件等
配合谷歌浏览器实现页面渲染功能
图片本地化、ip 代理等等
1 glouhao 2019-02-19 20:15:50 +08:00 via Android 膜拜大佬 |
2 DonnyChao 2019-02-19 20:52:53 +08:00 在 vps 上安装试了一下,挺好用的,感谢作者开源,学习一下,github 已 star。 |
3 zqjilove 2019-02-19 21:07:23 +08:00 早期用过一次,感觉体验很不好,至少和之前用过的一些采集工具比,感觉还是操作体验差一些。功能没问题。还是 DXC 用的爽,可惜现在也收费了 |
6 d5n 2019-02-19 21:51:50 +08:00 via iPhone 收藏 |
7 vus520 2019-02-19 22:21:12 +08:00 已经 600 个星星了 |
8 lunatic5 2019-02-20 08:28:01 +08:00 蓝天采集器,刚出来的时候用过,感觉很赞。。。不过好像在 v2 推过好几次了 |
9 tdwj12580 2019-02-20 10:11:48 +08:00 可以的,我也收藏一下,以后有用再使用! |
10 dany813 2019-02-20 10:20:06 +08:00 膜拜大佬 |
11 bzj 2019-02-20 10:23:52 +08:00 有没有演示站点 |
12 pinerge 2019-02-20 10:41:31 +08:00 采集一般都是 cli 吧,fpm 采集不是特别友好,就算把 php.ini 中 max_execute_time 设为无限有时进程也会莫名其妙的挂掉 |
15 runningman 2019-02-20 21:06:01 +08:00 via iPhone 关注一下 看看 |
16 willywu001 2019-02-28 14:57:38 +08:00 cookie 怎么设置的? |
17 willywu001 2019-02-28 14:58:12 +08:00 @zorlan cookie 怎么设置呢,文档中没看到 |
18 zorlan OP @willywu001 任务》采集器设置》请求头信息 里面 |
19 dwhzy 2019-03-15 12:56:48 +08:00 mark 一下,好工具~ |