更新于 12月25日

python大数据工程师(数据采集岗)

1-1.2万
  • 北京海淀区
  • 1-3年
  • 本科
  • 全职
  • 招5人

职位描述

电子/半导体/集成电路
岗位职责
1、参与数据采集平台架构设计和开发工作。
2、构建稳健的抓取任务调度、分布式采集与监控告警体系
3、持续对系统进行架构改造和优化,提升系统的稳定性与可扩展性,保障系统稳定,高效,安全。
4、负责多平台信息爬取。
任职要求
1. 计算机、软件工程、信息管理、数学等相关专业,本科及以上学历。
2. 熟悉 SQL,掌握基本的 SQL 优化技巧。
3. 熟悉 Python 用于数据分析处理,熟悉XPath语法,及逆向编程思维
4. 熟悉 常见数据库(如 MySQL、SQLServer),会基本的建表、索引设计。
5. 了解 Linux 基本命令,能进行数据脚本部署与日志排查。
5. 了解网页前端基础(HTML, CSS, JavaScript),能分析网页结构并提取数据
6. 具备一定的逻辑思维与数据敏感度,能快速理解业务需求。
7. 2年以上相关工作经验。
有如下经验者优先考虑
1. 熟悉 Hadoop/Spark/Flink 等大数据处理框架,有课程/实习项目经验。
2. 熟悉Python的常用框架和库(Flask、Pandas,Scrapy,Feapder,Selenium)。
3. 有数据抓取/数据分析相关实习或项目经验。
4. 熟悉HTTP、TCP/IP等网络通信协议以及数据抓包、分析;有一定的JS逆向能力,能解决普遍的移动端以及网页端加密问题。
5. 能构建稳健的抓取任务调度、分布式采集与监控告警体系

工作地点

北京海淀区1+1大厦(彩和坊路)6层609室

职位发布者

闫梦竹/人事经理

昨日活跃
立即沟通
公司Logo北京远大创新科技有限公司
北京远大创新科技有限公司成立于2000年,专注于电子元器件供应链服务领域,公司总部位于“中国硅谷”之称的北京中关村核心区,在深圳、上海、香港、苏州、杭州和成都等地设有分公司。凭借多年诚信经营和对市场环境的深刻了解,远大创新在客户、人才战略、销售网络、物流与仓储、资金实力、ERP管理系统等方面建立了全方位竞争优势。公司拥有四个仓储物流中心,三个技术支持中心,一个产品设计中心,一个信息管理中心,共有200多名卓越员工服务于1万余家不同领域的客户。远大创新将卓越的需求创造能力作为企业核心竞争力。在为客户提供物流和仓储服务的同时,进一步提供全面的技术支持和整体解决方案。目前,远大创新与五十余家国内外知名半导体厂商建立了密切的合作伙伴关系,通过推广其高素质的产品和对技术的持续投入,远大创新已成为能够满足客户多样化需求,具有强大研发能力的综合性方案供应商,产品广泛应用于汽车电子、轨道交通、仪器仪表、自动化控制、网络通信、医疗设备、智能家居等行业和领域。​远大创新建立了规范的组织结构和先进的ERP管理系统,并先后成功通过ISO9001:2000和ISO9001:2008质量管理体系认证。未来远大创新将继续拓展新的代理产品线和技术服务领域,不断加大对销售服务网络和技术研发的投入,我们真诚希望与广大员工携手共进,与业界同仁一道致力于中国电子产业的发展!
公司主页