更新于 今天

数据工程师

1-1.5万
  • 太原 万柏林区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

Python互联网电商产业互联网平台信息安全人工智能
岗位职责:
1. 负责电商平台(主流电商、垂直电商)数据爬取,包括商品信息、价格、评价、销量等核心数据,保障数据准确率和时效性。
2. 搭建、维护分布式爬虫系统,优化爬取效率,解决高并发、大规模数据采集问题。
3. 应对电商平台反爬机制(验证码、IP封禁、JS加密等),持续迭代反爬策略。
4. 负责爬取数据的清洗、整理、存储,对接后端数据接口。
5. 监控爬虫运行状态,及时排查爬取异常、修复程序漏洞。
6. 有应对复杂反爬虫场景的工程经验(如浏览器自动化、指纹规避、分布式代理池建设等)
7. 熟悉云原生环境与容器化部署(Kubernetes、Docker),掌握自动化监控与报警体系建设。
8. 具备一定 ML/LLM 数据管线经验,对数据标注、清洗、训练集构建等流程有实际参与。
9. 具备后续算力卡大模型部署兴趣并突破,开源大模型部署。
10. 具备AI Coding编程经验,能够熟练运用市面上的大模型编程(codex, claude, GLM),了解如何运用MCP SKILL等

任职要求:
学历:本科及以上,计算机、软件工程等相关专业优先,3 年以上后端或爬虫系统开发经验。
1. 语言:熟练掌握Python/Java,熟悉爬虫核心库(requests、Playwright、Scrapy等)。
2. 有3年电商平台爬虫经验,能独立完成电商数据爬取、解析、存储全流程。
3. 精通分布式爬虫开发(Scrapy-Redis等),能搭建多机协同爬取架构。
4. 熟悉常见反爬机制与应对方案(如验证码、IP 封禁、JS 混淆、动态加载、防爬 Headers 机制等),有实际对抗经验
5. 数据处理:熟悉Pandas、XPath、JsonPath,能完成数据清洗和格式化。
6. 存储技能:熟悉MySQL、MongoDB、Redis等数据存储方式,了解数据去重、缓存策略。
7. 加分项:掌握JS逆向、APP/小程序爬虫、验证码自动识别技术者优先。
8. 素养:责任心强,能独立解决问题,具备良好的沟通能力和抗压能力。
9. AI-Agent方向,了解Langchain体系。

工作地点

工作地点
太原万柏林区中海国际中心
位置图标
完善简历

公司信息

中联恒创(海南)科技集团有限公司

未融资 · 100-299人 · 房地产开发经营 已审核 已审核

35 个在招职位

公司介绍

中联恒创(海南)科技集团有限公司成立于2021年9月。在管资产32.65亿,是一家生态类科技型交付公司。集团以中瞳数融平台“生态云+政府赋能”、“生态云+企业赋能”及“生态云+双碳赋能” 打造政府、中瞳数融平台、生态伙伴共融共生的道场。

工商信息

企业名称 中联恒创(海南)科技集团有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 药立平
经营状态 存续
成立时间 2021-09-10
注册资本 3990万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

python爬虫工程师

1-1.5万 中联恒创(海南)科技集团有限公司
5-10年 本科 Python 互联网电商 产业互联网平台 人工智能 信息安全

python爬虫工程师

1-1.5万 中联恒创(海南)科技集团有限公司
5-10年 本科 Python 互联网电商 产业互联网平台 人工智能 信息安全

数据工程师(爬虫)

1-1.5万 北京佑卓君信管理咨询有限公司
3-5年 本科 爬虫开发 互联网电商

数据工程师(爬虫)

1-1.5万 北京佑卓君信管理咨询有限公司
5-10年 本科 数据挖掘 爬虫系统开发 后端系统开发 电商平台爬虫 Python Java 爬虫开发 AI-AGENT LANGCHAIN体系 Pandas 互联网电商

数据工程师

1-1.5万 中联恒创(海南)科技集团有限公司
5-10年 本科 Python 互联网电商 产业互联网平台 信息安全 人工智能
最新招聘
热门城市
热门职位
热门公司