V2EX bobobo80
 bobobo80 最近的时间轴更新
bobobo80

bobobo80

V2EX 第 177525 号会员,加入于 2016-06-15 13:23:26 +08:00
根据 bobobo80 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
bobobo80 最近回复了
赞一个,感谢内推
2019-06-11 14:27:46 +08:00
回复了 zhangslob669 创建的主题 求职 求职:两年爬虫经验
@zhangslob669 d3Viby5pQGJ5dGVkYW5jZS5jb20= 宇宙条感兴趣吗?
2019-06-05 11:33:03 +08:00
回复了 bobobo80 创建的主题 酷工作 [招聘][北京][字节跳动]抓取/后端工程师
@CEBBCAT 也招实习的,可以来试试
2019-03-06 23:46:00 +08:00
回复了 okzpy9425 创建的主题 酷工作 求工作[北京 Python ]
d3Viby5pQGJ5dGVkYW5jZS5jb20= 宇宙条感兴趣吗?
2019-03-06 23:42:53 +08:00
回复了 testphase 创建的主题 职场话题 在德国的中年码农 迷茫
国内晚上 11 点半可能才下班回家
2018-09-11 20:01:54 +08:00
回复了 kidlfy 创建的主题 Python 有人做过基于多个打码平台的验证码识别的服务吗?
@kidlfy 多平台同步,不就是爬虫的并发请求嘛,开几个协程或线程同时调用各个打码平台的 api 就可以。打码出错处理看你怎么个策略了,多个平台的结果不一样时怎么取值等,这就是业务逻辑了。
2018-09-11 14:21:00 +08:00
回复了 kidlfy 创建的主题 Python 有人做过基于多个打码平台的验证码识别的服务吗?
看起来是要做一个接口服务,一方面提供自行识别验证码的服务,一方面作为中转,将请求代理到各个打码平台。对于自己识别,大原理上就是接收图片,然后调用模型识别。对于转发,就是统一一下接口输入的参数和格式,把各个打码平台需要的参数适配一下,转发请求。
这个服务算是响应比较慢的了,建议使用异步的框架,里面还要转发请求,那么自带 server 和 client 的 aiohttp 比较合适了。识别的话,接触不多,之前用 tesseract 效果并不好,图片规律且有一定样本的话 tenseflow 调包训练一下效果就不错。
selenium 应该是没有办法返回类似 requests 的 status_code 的,所以需要自己来判断一下返回页面中是否包含正常的元素,elem = driver.find_element_by_id("XXX")。需要试出一些验证码,429,404 等页面的状态,加入状态判断。
2018-08-13 09:39:54 +08:00
回复了 bobobo80 创建的主题 程序员 不同源商品名匹配应该如何处理?
@coeo91 手工一个个指定吗?那工作量好大吧。
2018-05-04 13:28:26 +08:00
回复了 bobobo80 创建的主题 酷工作 [北京][招聘][人人车] 初/高级爬虫(抓取)工程师
@tuzigg 暂不支持
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3514 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 10ms UTC 05:07 PVG 13:07 LAX 21:07 JFK 00:07
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86