职位描述:
岗位职责:
1 、实时网站登录及网页抓取
2 、数据智能抽取、校对
3 、设计爬取策略,提升抓取系统的效率与质量
4 、抓取及抽取系统的新技术研究
5 、爬虫监控系统设计与开发
岗位要求:
1 、 2 年以上爬虫相关项目开发经验
2 、扎实的数据结构及算法基础
3 、熟练掌握 goLang,java,python,scala,c++中的至少一种
4 、深入了解 Http 协议 和 web 登录认证机制
5 、分布式系统架构经验
6 、熟悉搜索引擎和网络爬虫相关架构及技术
7 、熟悉 html, DOM, xpath ,正则表达式
8 、熟悉自然语言处理,信息抽取优先考虑
邮箱: [email protected]
岗位职责:
1 、实时网站登录及网页抓取
2 、数据智能抽取、校对
3 、设计爬取策略,提升抓取系统的效率与质量
4 、抓取及抽取系统的新技术研究
5 、爬虫监控系统设计与开发
岗位要求:
1 、 2 年以上爬虫相关项目开发经验
2 、扎实的数据结构及算法基础
3 、熟练掌握 goLang,java,python,scala,c++中的至少一种
4 、深入了解 Http 协议 和 web 登录认证机制
5 、分布式系统架构经验
6 、熟悉搜索引擎和网络爬虫相关架构及技术
7 、熟悉 html, DOM, xpath ,正则表达式
8 、熟悉自然语言处理,信息抽取优先考虑
邮箱: [email protected]