小白想做一个爬大麦演出信息的脚本, 但遇到滑块验证码不知道怎么办 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
yanyiming

小白想做一个爬大麦演出信息的脚本, 但遇到滑块验证码不知道怎么办

  •  
  •   yanyiming 3 月 29 日 3180 次点击

    我是做前端的, 想爬一下演出信息供个人使用, 不涉及抢票之类的. 想实现的效果是脚本自动打开网页, 然后手动拖码, 成功后把演出信息保存到本地. 自己用 node 试了试, 思路是把滑块相关的 script 下载到本地, 每次运行脚本时调用, 但各种混淆代码和加密数据弄得人头大, 最后还是只能把滑块展示出来, 过不了验证. 大家有什么更好的实现方案吗?

    18 条回复    2026-04-14 17:29:21 +08:00
    triptipstop
        1
    triptipstop  
       3 月 29 日
    lightpanda
    cairnechen
        2
    cairnechen  
       3 月 29 日
    手动拖码?你的意思是脚本模拟鼠标操作吧,你自己手动拖码有啥复杂的啊?
    UnluckyNinja
        3
    UnluckyNinja  
       3 月 29 日
    建个小号用无头指纹浏览器
    ayyayyayy2002
        4
    ayyayyayy2002  
       3 月 29 日 via Android   1
    node 是 nodejs 吗
    我比较喜欢用 python 和 playwright ,在网页上找要爬取的元素,右键,选择检查,复制元素和 xpath 发给 ai ,让 ai 写爬取代码
    验证码如果是简单的滑动验证码,临时使用的话找个能用命令使用的模拟点击软件,录制下验证码鼠标轨迹,用代码调用就行,缺点是会抢鼠标,如果要长期使用可以用代码在浏览器里跑 js ,用随机数和各种曲线计算模拟人类的滑动
    如果是点选的验证码先看看有没有逆向破解的现成代码,没有就只能自己批量采集数据,手动标注然后训练模型
    uqf0663
        5
    uqf0663  
       3 月 29 日
    滑块我主要调用 https://github.com/81NewArk/AntiCAP-WebApi 这个解决的,但是正确率不高,只能正确一半左右,相对比较浪费时间但是足够我用了。
    Ackvincent
        6
    Ackvincent  
       3 月 29 日
    交给 AI
    HMYang33
        7
    HMYang33  
       3 月 29 日 via Android
    虽然不想给别人免费打广告,但是提供一个渠道,之前用过一个 api ,平台名叫 云码,搜出来第一个就是
    SanjinGG
        8
    SanjinGG  
       3 月 30 日 via Android
    将滑块部分存图下来自己解,以前游戏用的是模板匹配
    Hashbaby
        10
    Hashbaby  
       23 天前
    yanyiming
        11
    yanyiming  
    OP
       18 天前
    @cairnechen 手动拖码后, 每次只能获取一页的数据, 再获取下一页就又要拖码.我想怎么才能一次拖码能获取多次数据呢.
    cairnechen
        12
    cairnechen  
       18 天前
    @yanyiming 听上去和喜马拉雅有点像
    cairnechen
        13
    cairnechen  
       18 天前
    @Hashbaby 大佬是用模型视觉识别的吗?怎么解决坐标漂移的问题啊?
    Hashbaby
        14
    Hashbaby  
       17 天前
    @cairnechen google 的免费模型
    cairnechen
        15
    cairnechen  
       17 天前
    @Hashbaby 惊了 gemini 这么强吗,我用 Opus4.6 和 GPT5.4 视觉处理图片坐标漂移好大
    Hashbaby
        16
    Hashbaby  
       16 天前
    @cairnechen 我试了好几家平台的模型 都能够进行准确识别 关键是提示词怎么写 然后还要输出为纯净的坐标 最后拿去使用
    yanyiming
        17
    yanyiming  
    OP
       11 天前
    @Hashbaby 你是怎么处理混淆和加密的呢?
    Hashbaby
        18
    Hashbaby  
       11 天前
    @yanyiming 没处理 都交给 AI 识别的啊 然后我处理图片上的坐标就行了 需要源码吗 卖你 之前我随手写的 但是还有点 BUG 识别率不高 估计是加了机器轨迹识别
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1101 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 68ms UTC 18:05 PVG 02:05 LAX 11:05 JFK 14:05
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86