更新于 今天

python爬虫工程师

8000-12000元
  • 成都武侯区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

Python数据清洗数据采集反爬虫分布式爬虫
岗位职责:
1、负责大数据产品所需网站的信息抓取、解析、清洗等研发与优化工作;
2、负责反爬虫策略研究,代理IP、验证码识别等采集支撑服务建设;
3、负责大规模文本、图像数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作;
4、负责公司爬虫的技术调研以及策略优化。
任职要求:
1、本科以上学历,1年python爬虫、数据清洗相关经验;
2、熟练使用scrapy框架,对其内部运行机制有深刻理解;
3、熟练使用selenium、Splash等一种或多种自动化工具;
4、熟练使用python多进程、多线程;
5、熟悉MYSQL、MongoDB、Redis、Es等数据库的使用;
6、熟悉Fiddler等一种或多种抓包工具;
7、熟练使用正则、xpath等数据解析库;
8、熟悉常见的反爬技术(验证码破解、IP代理、JS解密,app逆向、指纹);
(以下加分项)
9、有Hadoop生态相关应用经验者优先录用;
10、使用或开发过爬虫监控系统者优先录用;
11、对前后端有一定经验者优先录用。

工作地点

武侯区成都高新孵化园1号楼A座座1-9号附1号2楼

认证资质

营业执照信息

职位发布者

袁巧/人事经理

今日活跃
立即沟通
公司Logo摩熵数科(成都)医药科技有限公司
摩熵数科(成都)医药科技有限公司成立于2020年12月,位于中国(四川)自由贸易试验区成都高新区,是摩熵智能旗下核心平台公司,是集生命科学、数据科学、人工智能技术于一体的高科技企业,已获高新技术企业、省级“专精特新”企业资质认证。公司业务覆盖生物学、化学、药学、医学四大核心领域,服务贯穿生命科学产业投资、立项、研发、注册、生产、销售及医疗全链条,已服务近千家医药类、金融类和信息类企业。公司自主研发以BCPM数据架构为核心的平台,整合超10万个数据源,建成包含15大矩阵、200+子库、50亿+结构化数据的数据库集群,拥有100余项发明专利和软件著作权;作为全球新药发现中心首批核心成员单位,还与中国药科大学理学院开展校企合作,持续赋能生物医药产业创新转化。
公司主页