更新于 8月5日

数据工程师

6000-12000元
  • 北京门头沟区
  • 经验不限
  • 本科
  • 全职
  • 招2人

职位描述

岗位职责:
1. 熟悉搜索引擎和网络爬虫相关技术,有爬虫系统开发经验;
2. 熟练掌握网页抓取原理及技术,熟悉网页解析过程,具备数据的过滤、清洗、去重、结构化导入经验;
3. 熟悉分布式爬虫应用和调度策略,掌握各类网站的反爬机制和验证码机制;
4. 熟悉TCP/IP协议及HTTP协议,了解基本的前端技术,HTML、CSS、JS、Ajax等;
5. 熟练使用mysql,mongodb等数据库,熟悉mysql的各种存储引擎,熟悉索引工作原理。
任职要求:
1. 大学本科及以上学历,计算机相关专业,基础扎实;
2. 具有Python开发工作经验,熟悉Python常用函数库和包;
3. 熟练掌握python,熟悉常用爬虫框架中的一种或多种,熟悉Scrapy、Pyspider框架中的至少一种;
4. 熟悉MySql、Redis、MongoDB等数据库,对SQL优化有一定的经验;
5.熟悉网页抓取原理及技术,熟练掌握正则表达式、XPath、CSS等网页信息抽取技术;
6.具有优秀的团队合作和沟通协作能力,善于学习,能承受较大的工作压力。

工作地点

北京市 门头沟区 莲石湖西路98号院801

职位发布者

尹女士/人事

昨日活跃
立即沟通
公司Logo北京迈迪培尔信息技术有限公司
北京迈迪培尔信息技术有限公司(MedPeer®)于2017年在北京市中关村门头沟科技园成立。公司以人工智能技术为基础,实现科研资源的优化配置为目标,“让科研变得更容易”为导向,立足于提供全流程的生物医药科研服务,帮助广大有思路、有魄力的科研工作者都能有机会实现有益的探索。成立两年来,企业励精图治,锐意进取,紧密围绕科研服务这个核心,不断完善科研全周期服务体系,打造出目前国内领先的生物医药科研服务平台。2018年获评中关村高新技术企业,2019年通过双软认证并获评科技型中小企业,“基因-变异-疾病关系知识库构建系统”获北京市新技术新产品(服务)认定。现拥有包括发明专利在内的知识产权二十余项,为全国30万科研工作者和上百家知名企业和科研院校提供专业科研服务服务。
公司主页