有没有做爬虫的 V 友看工作的啊,急需 5 个伙伴, base 深圳 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
外包信息请发到 /go/outsourcing 节点。
不要把相同的信息发到不同的节点
derekxu18
V2EX    酷工作

有没有做爬虫的 V 友看工作的啊,急需 5 个伙伴, base 深圳

  •  
  •   derekxu18 2021-03-10 18:00:34 +08:00 1891 次点击
    这是一个创建于 1707 天前的主题,其中的信息可能已经有所发展或是发生改变。
    公司介绍:
    东信成立于 2004 年,专注于移动互联网的研究,以移动技术为驱动,集移动技术研发、移动媒体运营、移动公关和整合营销服务于一体,致力于中国区域市场和移动受众的定向研究,为商业客户提供移动跨媒体整合营销传播服务,是中国内优秀的本地移动营销服务提供商。截至目前,公司总共有 600 名左右的员工,且东信已在国内 20 多个重点城市设立本地化营销分支机构。
    职责描述:
    1 、负责设计、开发、维护、重构分布式爬虫系统;
    2 、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析;
    3 、设计爬虫反屏蔽规则,提升网页抓取的效率和质量;
    4 、负责大规模爬虫系统的核心技术研究和开发;
    5 、实现数据提取、清洗、结构化、入库、统计分析等需求。
    任职要求:
    1 、本科学历,计算机相关专业,3 年以上爬虫开发经验;
    2 、Pyhton 语言基础扎实,有良好的编程功底和编码习惯;熟悉 java 优先;
    3 、熟悉 HTTP 、HTTPS 等网络协议及数据抓包、分析;
    4 、掌握相关的数据存储工作,掌握 mysql 、redis 、mongodb 、es 、hbase 等相关技术,有数据库调优的经验;
    5 、必须熟悉 app 数据爬虫,熟悉 pc 端数据采集;
    6 、熟悉反爬机制,处理账号限制、复杂验证码、模拟登陆等疑难问题;
    7 、熟悉 js 逆向、app 逆向优先;
    8 、具备大规模爬虫系统设计能力,熟悉评论采集等常见数据采集任务。
    我的 wechat ID 是 dereckxu,感谢了。。
    4 条回复    2021-03-11 12:07:20 +08:00
    jatai
        1
    jatai  
       2021-03-10 19:01:10 +08:00 via Android
    牢友记
    BlackZhu
        2
    BlackZhu  
       2021-03-10 20:19:14 +08:00
    爬虫写得好 下一句!
    ErwinCheung
        3
    ErwinCheung  
       2021-03-10 21:00:48 +08:00
    爬虫还一次性要五个小伙伴吗
    zeromake
        4
    zeromake  
       2021-03-11 12:07:20 +08:00 via Android
    @ErwinCheung 这样可以背 5 次锅啊
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3471 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 04:29 PVG 12:29 LAX 20:29 JFK 23:29
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86