
俺尝试自学爬虫,网络上的爬虫相关的教程或者书,逻辑基本都差不多:python 基础->request 和 respond 的简单认识->requests 库的介绍和简单实战->简单数据库介绍->简单介绍 cookie->简单介绍反反爬->最典型的那个爬虫框架(好久没用忘记名字了)的简单介绍和实战
但是当自己想应用所学在自己的项目实践写一个签到时,一上来就感到很强的阻力,阻力主要来源于:
故想请教一下各位大佬,有没有交流环境比较好的学习、交流爬虫相关技术的论坛,想认真学习一波
或者有特别棒的教程、书之类的能推荐一波就更好啦
俺一直有一个很小白的问题,就是常用的数据库吧(比如 MySQL 、Mongodb 之类的),方便直接存储媒体文件吗
1 christopheredwar Jul 30, 2021 几乎没有,爬虫早就被培训班垄断了 |
2 israinbow Jul 30, 2021 数据库存媒体文件是自杀行为, 除非你的库又大又快. 学爬虫不如学反爬虫, 了解了反爬虫原理才能钻漏洞去爬, 谓之知己知彼百爬百漏. 同样插眼等一个社群...... 我先来: 真刑啊, 越来越有判头了. |
3 shilianmlxg Jul 31, 2021 via iPhone 想蹲个全场最佳。前端想学 python 不知道从哪里下口 |
4 Zy143L Jul 31, 2021 via Android 爬虫写得好,牢饭吃的饱。 |
5 kblacksheep Jul 31, 2021 看来去牢里交流是最快的 doge |
6 flgn88 Jul 31, 2021 via iPhone prison |
8 locoz Jul 31, 2021 @locoz #7 打错了,是 https://bbs.nightteam.cn |
9 locoz Jul 31, 2021 via Android @shilianmlxg #3 学 Python 和学爬虫实际是两码事,爬虫不仅限于 Python 的。 |
10 shilianmlxg Jul 31, 2021 via iPhone @locoz 感觉都有种错觉了 感觉要学 py 。学 excel 批处理文件 教程视频是用的 py 。学 docker k8s 教程是用的 py 。学数据结构 教程是用的 py 。学算法 教程视频是 py 。感觉无处不在 |
11 ch2 Jul 31, 2021 当你有了极其强大的技术实力,是会去做爬虫还是钱更多而且不用担心法律风险的工作? 反爬虫核心就是提高成本,让那些即使有能力突破反爬技术的人宁愿干别的也不来做爬虫 |
12 learningman Jul 31, 2021 via Android 先把 js 学明白了吧,至少 webpack 编译过以后的东西勉勉强强能看得懂。 |
13 ipwx Jul 31, 2021 爬虫的关键不在爬虫,而是整个网络原理的掌握。从 TCP 到 HTTP 到 HTTPS 。并发还得学系统的一些东西。 |
14 locoz Jul 31, 2021 via Android @shilianmlxg #10 Python 本来就是一个难度不高的万金油语言啊,无处不在没啥问题。 |
15 locoz Jul 31, 2021 via Android @ipwx #13 对于爬虫而言,网络原理只是一部分,而且对于当下环境里的大多数场景而言不会需要用到特别深的东西…真正对于大多数人和职位的关键其实在于偏安全领域的逆向,没有逆向能力基本搞不定复杂需求。 |
16 ericgui Aug 3, 2021 北京市第一看守所 |