职位年薪:20-30万
所属行业: 互联网/移动互联网
所属部门:研发部门
企业性质:私营·民营企业
企业规模:100-499人
岗位职责:
1. 负责传统网页和微博及SNS网站信息高效采集与正确解析;
2. 负责网页爬虫架构设计与核心技术研发;
3. 负责互联网资源的特征挖掘,主要对网页特征、站点结构、资源变化趋势等进行数据分析和特征建模;
4. 设计策略和算法,提升网页抓取的效率和质量,进一步解决系统的网页排重、垃圾控制、资源划分等问题;
5. 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进。

