
对于 scrapy 中验证码怎么处理?(比如说登录知乎,现在需要验证码)
我的想法是通过 scrapy 把验证码下载下来,手动打码方式。
那么问题来了, scrapy 如何保持同一个 session 去下载验证码呢?
因为我之前用 requests 登录知乎 https://gist.github.com/Xarrow/69b971521f807924db77 ,保持一个 session ,下载验证码图片,在用这个 session 登录,可以成功。
我的想法是在 scrapy 中先用 requests 登录完,把 session 传给 scrapy 中的 cookiejar:requests.session(),
请问这样做可以么?或者有更好的方法么?
求大神给出示例~
1 iseliget 2016-01-17 02:41:00 +08:00 我要是没记错的话, Python 有个专门识别验证码的 library |
3 sunchen 2016-01-17 11:32:42 +08:00 想省心就接入打码平台 |
4 junnplus 2016-01-17 12:31:11 +08:00 via Android 楼上的答案好像不对楼主的问题 |
6 donghouhe 2016-01-17 20:27:27 +08:00 用 tesseract 识别验证码过,可是姿势不对,效果不好(未试与 scrapy 搭配过) |
8 xarrow OP 已经解决,一个字:直接上 cookies , 不过我是先用 requests 登录,因为比较熟悉,然后再把 cookies 保持下来,传入 scrapy 的 cookies 中 |
9 mikezhang0515 2016-01-26 17:24:29 +08:00 小心爬着爬着退出了 |