
验证码 url 是固定的,但返回结果每次都变: https://www.jszwfw.gov.cn/jsjis/component/verifyCode.do?code=4&var=rand&width=162&height=55&random=0.34837298861771937
我目前是用自动化用 selenium ,识别 ocr 是腾讯云,请问怎么样才能实现 自动化填验证码?
1 seansong 349 天前 很刑 |
2 Ct5T66PVR1bW7b2z 349 天前 ddddocr |
3 nyxsonsleep 349 天前 直接买服务,根据难度,会比较贵。 破解验证码本身就能赚钱,技术含量也比爬虫高,甚至可能是里面技术含量最高的内容。 |
4 NoOneNoBody 349 天前 gov.cn ……这个不敢碰 |
6 xuanbg V2 真是什么样的人才都有 |
7 dji38838c 349 天前 水平越初,胆子越大 |
9 Leofits 349 天前 via Android 很刑很可拷 |
10 hanssx 349 天前 兄弟,这个 uuid 要是根据客户端生成的,你有点自我暴露了就 |
11 csulyb 349 天前 你想想为啥人家要弄一下验证码? 本来可以不用弄验证码的,就是因为楼主这样的憨憨 进去太多了 |
12 shadowyue 349 天前 很刑,出来了给大家讲讲里边的生活 |
13 vevlins 349 天前 爬虫把政务网站搞挂被判刑的事你是没听说过? |
14 huage 349 天前 肉身在国外随便搞,在国内老老实实。 |
15 fanhaipeng0403 349 天前 疯了吧你。 |
16 sir283 349 天前 一、找打码平台,租接口。 二、逆向网页 js ,尝试绕过对应逻辑,使其拿到对应的算法与出入参数,模拟 success 请求。类似中间人。 三、黑掉对方服务器,直接提取数据。 四、自己训练 ocr 模型。 五、放弃。 |
17 TArysiyehua 349 天前 提供技术咨询,有意联系 |
18 paopjian 349 天前 爬政府网?你在想什么呢 |
19 sampeng 349 天前 via iPhone 刚看完新闻,年底了进去一堆爬虫小子…我还想哪来二的猛人爬个网站把自己送进去。这不就看到,有哥们急着进去吃年夜饭。 |
20 gjw8u8 349 天前 via Android 这个牛逼 |
21 Lukedis 349 天前 狠人大帝都没你狠,怼着政府网站爬 |
22 ggabc 349 天前 via Android 注意原则 |
23 kele999 349 天前 不要犯罪 |
24 Liftman 349 天前 你好,已将您的行为投递到对应网信办。 |
25 opengps 349 天前 爬虫不爬 gov 这是底线 |
27 raycool 349 天前 这种验证码没难度,但是这类网站很刑 |
29 Y25tIGxpdmlk 349 天前 目测这个验证码没什么难度,用 10 年前的打码技术都能轻松搞定,更何况现在有些 AI 识别和人工打码了。 还有,验证码哪个不是随机变化的,我还以为是那种 GIF 的动态验证码呢 |
30 et5494 349 天前 0 难度,但是不敢 |
31 guanhui07 349 天前 果然很刑 |
32 TophTab 349 天前 GOV ?老哥干的是体制内的活? 我只知道以前大学老师会去干这个 |
33 EndlessMemory 349 天前 截图识别啊 |
34 wzblog 349 天前 放过自己吧,你看他验证码连基本的干扰都不做,随便识别的。搞 gov 很容易吃国家饭的。 |
35 42V0CdLjCU494ogF 349 天前 大把这样的服务商,比如 https://www.jfbym.com/ 非要自己写的话用 OCR+AI 自己调教一下也够了 |
36 dbow 349 天前 建议不搞,政府的网站,你也知道的,性能不可能很好,万一被你刷崩了,估计要吃牢饭。 |
37 Ackvincent 349 天前 直接买服务,不要再验证码上折腾,掉服务商的 API 就行了。 |
38 GBdG6clg2Jy17ua5 349 天前 即使你可能是某个地市或者啥的供应商,但是你用爬虫把省数据局的网站搞崩了,作为维护系统的乙方,为了能继续拿到这个项目,他们肯定想方设法甩锅,然后你一定会揪出来。然后恭喜你,你可能得进去了。 |
39 isSamle 348 天前 https://www.jszwfw.gov.cn/jsjis/component/verifyCode.do?code=4&random=0.41377034550816183 通过随机数后端计算返回验证码图片,上 OCR 吧 |
40 chenzi0103 348 天前 给到 llm 识别就好了 用个好的 llm 模型 |
41 shangfabao 348 天前 selenium +ocr,ocr 用的第三方库 搞过 |
42 wty95 OP |
43 zengxs 348 天前 |
45 lanten 348 天前 有趣的,看到 gov 就吓到腿软 |
46 GBdG6clg2Jy17ua5 348 天前 @lanten 有时候是百口难辨的。比如前几年的美国一位安全教授通过查看 html 页面获得几位老师的社保号码,被认为是黑客攻击。 |
47 securityCoding 348 天前 兄弟,有些内部的爬虫自动识别 gov.cn 关键词 return 掉。。。 |
50 akura 347 天前 先生大才 |
51 BBBOND 341 天前 https://www.gov.cn/zhengce/content/202409/content_6977766.htm 自 2025 年 1 月 1 日起施行 第十八条 网络数据处理者使用自动化工具访问、收集网络数据,应当评估对网络服务带来的影响,不得非法侵入他人网络,不得干扰网络服务正常运行。 第五十五条 违反本条例第十二条、第十六条至第二十条、第二十二条、第四十条第一款和第二款、第四十一条、第四十二条规定的,由网信、电信、公安等主管部门依据各自职责责令改正,给予警告,没收违法所得;拒不改正或者情节严重的,处 100 万元以下罚款,并可以责令暂停相关业务、停业整顿、吊销相关业务许可证或者吊销营业执照,对直接负责的主管人员和其他直接责任人员可以处 1 万元以上 10 万元以下罚款。 先生请自重 |