工作内容:
1、参与爬虫系统的架构设计和开发,负责指定网页及APP数据采集研发工作
2、参与爬虫核心算法的策略优化,设计爬虫策略及反爬规则,提升数据采集效率和稳定性
3、能够根据业务需求,实现页面解析和结构化抽取,数据清洗、海量数据存储和读取等。
任职要求:
1、计算机相关专业,1年以上爬虫开发经验
2、熟悉tcp,http协议原理;熟练掌握python开发,至少熟练掌握主流爬虫框架中的一种,熟悉常用的库requests/gevent等。熟悉常用的数据结构和算法。
3、熟悉常见的反爬虫技术及其解决方案,熟悉JavaScript开发及逆向经验,或有Android/IOS 端的采集和逆向经验
4、了解Mysql、MongoDB,Redis、hive数据存储读取技术,能够熟练使用一种数据库相关技术
5、具有良好的自学能力,能通过研究开源项目来解决开发中遇到的难题。
6、有责任心、敢于担当,工作积极主动,具备良好的团队合作精神,能融入多功能团队,并与其他部门同事进行良好的沟通及合作。