更新于 3月21日

大数据工程师(数据采集) (MJ000937)

2-3万·15薪
  • 北京海淀区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

数据爬虫PythonScrapyrequests
岗位职责:
1、负责相关各类网站及平台的数据采集方案设计与开发,搭建高效、稳定的爬虫系统,确保数据采集的准确性、完整性和时效性;
2、​针对目标平台的反爬机制(如 JS 加密、Token 验证、验证码、IP 封禁等),进行 JS 逆向分析与破解,优化爬虫策略,解决采集过程中的技术难题;
3、重点负责相关平台的数据采集,深入理解电力行业数据结构与业务逻辑,保障行业数据的有效获取;
4、开发新的爬虫项目,监控数据采集状态,及时处理异常情况(如网站结构变更、反爬升级等),确保系统稳定运行;
5、配合项目需求,接受短期出差任务, 可完成出差期间的现场工作安排。
任职资格:​
1、本科及以上学历,计算机科学与技术、软件工程、电气等相关专业优先,1-5 年爬虫开发经验;
​2、精通 Python 编程语言,熟练使用 Scrapy、Requests、BeautifulSoup、Selenium、Playwright 等爬虫框架及工具;熟悉 HTTP/HTTPS 协议、TCP/IP 协议,能熟练分析请求头、Cookie、Session 等参数;
3、熟练掌握 JavaScript 语言,能使用 Chrome DevTools、Fiddler 等工具分析网站请求流程,破解 JS 加密、参数签名、动态 Token 等反爬措施;有过复杂网站(如电商、金融、能源类平台)JS 逆向经验者优先;
4、熟悉常见的数据库(如 MySQL、MongoDB)操作,能将采集的数据高效存储与管理;
5、接受短期出差(每年出差频次及时长根据项目需求调整),持有 C1 及以上驾驶证,驾驶技术良好优先。
6、工作认真,责任心强。

工作地点

北京海淀区中关村集成电路设计园

认证资质

营业执照信息

职位发布者

马妍明/招聘主管

三日内活跃
立即沟通
公司Logo北京海博思创科技股份有限公司
北京海博思创科技股份有限公司(简称“海博思创”,股票代码:688411)是行业领先的储能系统解决方案与技术服务供应商,专注于储能系统的研发、生产、销售和服务,为传统发电、新能源发电、智能电网、终端电力用户及智能微网等“源-网-荷”全链条行业客户提供全系列储能系统产品,及储能系统一站式整体解决方案。公司是国家级高新技术企业、国家专精特新“小巨人”企业、国家企业技术中心、北京市隐形冠军企业、北京市民营企业百强。公司拥有国内领先的CMA和CNAS认证的电池及电池系统测试实验室,获准成立了电化学储能系统博士后工作站,并牵头成立了北京市未来电化学储能系统集成技术创新中心。公司拥有自主知识产权的电池建模、电池管理、系统集成、系统验证、智能运维等核心技术,通过先进技术手段有效提高系统安全性、延长电池使用寿命、降低系统运维成本、提高能源利用效率,确保资产价值。根据中国电力企业联合会(简称“中电联”)统计,截至2024年年底,国内已投运电站装机量排名中,海博思创位居第一。根据标普全球(S&P Global)统计,海博思创在2024年全球电池储能系统集成商新增储能装机排名中位居前三。同样来自该机构截至2025年7月的数据显示,在以累计装机和签约项目规模总和统计的排名中,海博思创位列中国大陆市场第一。
公司主页