公司:宜信
部门:大数据创新中心
地点:北京-西大望路
职位:爬虫工程师
职责:
1 、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2 、负责网页信息抽取、数据清洗等研发和优化工作;
3 、负责抓取数据的深度提取和挖掘。
要求:
1 、熟悉 linux 平台开发,精通 Python/C++/Java 三种编程语言中的至少一种,热爱 python 编程;
2 、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
3 、熟悉 Mysql ,有过数据库调优和海量数据存储经验优先;
4 、具有搜索相关技术研发经验者优先;
5 、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先。
联系: [email protected]
以上!
部门:大数据创新中心
地点:北京-西大望路
职位:爬虫工程师
职责:
1 、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2 、负责网页信息抽取、数据清洗等研发和优化工作;
3 、负责抓取数据的深度提取和挖掘。
要求:
1 、熟悉 linux 平台开发,精通 Python/C++/Java 三种编程语言中的至少一种,热爱 python 编程;
2 、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
3 、熟悉 Mysql ,有过数据库调优和海量数据存储经验优先;
4 、具有搜索相关技术研发经验者优先;
5 、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先。
联系: [email protected]
以上!
