看到腾讯一个月 1000 次, 百度是 50000/天
还有其他的吗 可以用来爬 dz 论坛吗

看到腾讯一个月 1000 次, 百度是 50000/天
还有其他的吗 可以用来爬 dz 论坛吗
1 supermoonie Jul 7, 2020 via iPhone 讯飞,网易,做云的,都有吧 |
2 supermoonie Jul 7, 2020 via iPhone @supermoonie 哦....验证码识别,我说的是 OCR |
3 lihongming Jul 7, 2020 via iPhone 百度那个准确度还可以,不过看起来你要想免费的……要是找到的话也给大家分享一下吧。 |
4 bzj Jul 7, 2020 github 上找开源库自己搭一个 |
6 locoz Jul 7, 2020 你要说具体是什么样的验证码别人才好给你推荐... |
8 yujiang Jul 7, 2020 via Android 啥验证码?图片,滑动,还是 hcaptcha 这样的 |
9 autoname OP |
10 flowercoder Jul 7, 2020 其实用本地的效果也不错,不一定非要调 api,这东西不就是限制非人类嘛,其实可以从限制接口访问次数等其他方面去做限制 |
13 autoname OP @flowercoder 我就菜鸡一个,连百度都搜不到 相关的教程资料,很少,要么不能用,要么都是安卓的,谷歌又答非所问,搜的结果和我预期的相差很多,很少用谷歌 |
14 SingeeKing PRO |
15 autoname OP @SingeeKing 收到,谢谢大佬。我研究研究 |
16 flowercoder Jul 7, 2020 @autoname 我看错了,你是要爬对吧,我刚试过 muggle_ocr,很不错,完全满足我的要求,还能调用我的 gpu,强烈推一下。昨天找的时候还试了下 ttshitu 这家收费的,测试了下也都对,一条 0.2 厘吧,感觉也能试试。tesseract 我也试了,我那种他跑不了。 |
17 autoname OP @flowercoder 对呀 爬帖子,有些帖子 隐藏回复 才能看到的, 所以。。。 |
18 chenuu Jul 7, 2020 via Android 超级鹰 |
20 locoz Jul 7, 2020 |
25 autoname OP |
26 autoname OP |
27 locoz Jul 7, 2020 @autoname #25 看了一下 okhttp3 的文档 你先请求那个验证码图片的地址,然后调用 Response.body().bytes()获取到图片的二进制。 接着,用 new Request.Builder().url("http://127.0.0.1:7788/").post(img).build();去请求识别接口。 |
29 koala9527 Jul 7, 2020 文字数字可以做字库解决的。看我的 https://zhuanlan.zhihu.com/p/146051002 |
31 autoname OP @locoz 大佬 弱弱的问下 jsoup 是这样 请求图片吗 我怎么。。 https://cdn.jsdelivr.net/gh/post-get/static/b25b023d9d184243a30867c02d952edf.png |
34 shc Jul 7, 2020 我都用的斐斐 http://www.fateadm.com/ |
35 xuanbg Jul 8, 2020 1 、自己搞个开源库来写代码解决 2 、淘宝打码 3 、两者结合 爬虫写得好,牢饭吃到饱。楼主千万要三思而后行啊 |
37 csavvv Jan 9, 2021 |