
本来我只是随便玩玩,没想到后来不断改进成了现在这个样子。

刚开始的时候就几个节点,后来慢慢增加到了现在大约快 200 个节点,爬虫代码也写了一千行(不算调度与杂项), 这些节点根据多方面考量,大致分为 五分钟、一刻钟、一个小时、三个小时、六个小时、十二个小时、二十四个小时等不同的定时爬取等级。
有利益考量,也有发电情怀。

其中 pages 就是 总页面数,count 就是你获取的条数,data 里面的每一个成员都是一条新闻,包含了标题、链接、热度等信息。知乎实时热搜数据大约 50 条,如果你取每页 50 条数据,那么返回的 pages 就会为 1
自己写的爬虫,还算挺稳定的,除了个别偷懒的节点,主流节点自从我写完以后基本没有出过问题。
QQ 群:114177
如果你有好的节点分享, 我也会考虑写一个对应的爬虫。 谢谢。
1 Tink PRO 好人 |
2 Austin2035 OP xdm,别光收藏,不如来评论一下 |
3 ansonsiva 2020-08-06 22:01:38 +08:00 收藏了 |
4 xJogger 2020-08-06 22:07:46 +08:00 很不错,改天试试用 Scrapy 爬取一下。 |
5 Austin2035 OP @xJogger xd,api 给你们就是不想让你们爬 |
6 qilishasha 2020-08-06 22:17:54 +08:00 via iPhone API 是啥?这是否定我们写爬虫的能力吗? |
8 lloovve 2020-08-06 22:44:11 +08:00 via iPhone 群号牛逼啊 |
9 Austin2035 OP |
10 revalue 2020-08-06 22:46:17 +08:00 时间真多 |
11 revalue 2020-08-06 22:46:55 +08:00 多谢老哥 |
12 HereApp 2020-08-06 22:51:52 +08:00 请问 综合 新闻 科技 财经 社区 汽车 购物 阅读 影音 首页这一排的 API 是什么? |
13 Austin2035 OP @HereApp 这些都是大节点中最重要的一个子节点,群内讨论吧。 |
14 kingddc314 2020-08-07 10:30:14 +08:00 赞一个 |
15 keepfun 2020-08-07 11:40:03 +08:00 域名 和内容 十分契合 炫目好的域名+好的内容 的组合体 |
16 40EaE5uJO3Xt1VVa 2020-08-07 13:41:55 +08:00 好人一生平安 |
17 pikaconan 2020-08-07 15:02:01 +08:00 666 |
18 wukong1024 2020-08-07 17:25:35 +08:00 好人一生平安 |
19 sadghgfsf542332 2020-08-08 11:14:15 +08:00 这个站要火! |
20 bulaocai 2020-08-08 11:31:12 +08:00 谢谢 分享 已经收藏了 |
21 hrbwaxdoll 2020-08-10 14:25:32 +08:00 @lookcos 加个微信呗,有合作需求 waxdoll |
22 justin2018 2020-08-11 10:08:56 +08:00 很不错,改天试试用 Scrapy 爬取一下 |
23 janda 2020-08-12 11:36:02 +08:00 好东西、收藏了 |
24 lavvrence 2020-08-13 16:32:18 +08:00 伸手党:想要一个命令行客户端。 |
25 tonfy 2020-08-17 17:42:49 +08:00 好东西,收藏了 |
26 touno 2020-08-18 15:36:45 +08:00 弱弱的问一句~这侵权违法吗? |
27 huruji 2020-08-20 12:57:43 +08:00 收藏 |
28 yigemeirenyongde &nsp; 2020-09-17 10:31:29 +08:00 好人一生平安 |