更新于今天

AI数据采集（爬虫）

1.1-1.5万

杭州余杭区
1-3年
本科
全职

数据爬虫Python产业互联网平台

岗位职责
1. 负责互联网公开数据的采集、清洗、结构化与入库，支撑 AI 应用、模型训练、知识库和数据分析业务。设计并开发高稳定性的爬虫系统，包括网页解析、动态页面采集、反爬策略应对、任务调度、代理管理和异常监控。
2. 针对不同网站结构，构建可复用的数据抽取规则和自动化解析流程，提升采集效率和数据质量。
3. 参与数据治理工作，包括去重、字段标准化、质量校验、数据溯源和更新机制设计。
4. 与算法、产品和业务团队协作，理解 AI 场景下的数据需求，输出可用于 RAG、训练、评测或业务分析的数据集。
5. 跟踪大模型、Agent、智能解析、网页理解等技术，探索 AI 辅助爬虫和自动化数据采集方案。
6. 遵守数据合规要求，确保采集范围、使用方式和存储流程符合相关法律法规及网站规则。
任职要求
1. 本科及以上学历，计算机、软件工程、数据科学等相关专业优先。
2. 熟练掌握 Python，熟悉 Scrapy、Requests、BeautifulSoup、Playwright、Selenium 等爬虫和浏览器自动化工具。
3. 熟悉 HTML、CSS、JavaScript、网络协议、浏览器渲染机制，能独立分析网页结构和接口请求。
4. 熟悉常见反爬机制及应对思路，如验证码、动态渲染、签名参数、频控、IP 限制、登录态管理等。
5. 熟悉 MySQL、PostgreSQL、MongoDB、Elasticsearch、Redis 中至少一种数据存储或检索系统。
6. 具备良好的数据清洗、文本处理和结构化能力，能处理多源异构数据。
7. 了解大模型、RAG、向量数据库、Embedding 或 AI 数据工程相关概念者优先。
8. 具备较强的问题排查能力、工程稳定性意识和合规意识。

工作地点

杭州余杭区阿里巴巴西溪C区

位置图标

完善简历

工商信息

企业名称小葱（江苏）信息科技股份有限公司

企业类型股份有限公司（非上市、自然人投资或控股）

法人代表戴蕾

经营状态存续

成立时间 2019-09-20

注册资本 2000万元

查看全部信息

营业执照信息

5000-10000元铁岭枫途人力资源有限公司

大专在校大学生兼职、居家办公师范大学大学生线上兼职

5000-6000元杭州壹锐科技有限公司

本科 1-3年人工智能计算机软件物联网产业互联网平台计算机硬件电气机械/电力设备

40-60元/时四川天贤途人力资源有限公司成都锦江分公司

无经验限制居家兼职不限时间地点时间自由安排

6000-7000元浙江爱才人力资源股份有限公司

大专数据爬虫 ADB命令数据采集抗压能力强舱内数据采集接受加班周末双休无责底薪加班费节假日3倍社保

5000-6000元杭州壹锐科技有限公司

本科 1-3年数据埋点数据抽取场景交互数据视觉图像采集运动控制数据语音采集传感器数据工业自动化/机器人人工智能产业互联网平台

5000-6000元爱才集团有限公司

大专 1-3年数据采集数据标注手机测试云计算计算机软件产业互联网平台早九晚六周末双休

60-80元/时四川天贤途人力资源有限公司成都锦江分公司

会杭州方言

1.7-2万小葱(江苏)信息科技股份有限公司

本科 3-5年数据爬虫数据埋点数据抽取反爬虫分布式爬虫 Python 软件/IT服务

1.1-1.5万小葱(江苏)信息科技股份有限公司

本科 1-3年数据爬虫 Python 产业互联网平台

60-80元/时四川天贤途人力资源有限公司成都锦江分公司

会杭州方言

5000-8000元·13薪深圳市正阳网络科技有限公司

本科 1-3年数据爬虫数据埋点云计算

6000-12000元浙江灵企智能科技有限公司

大专 1-3年人工智能工业自动化/机器人

8000-12000元上海智航创网络科技有限公司

大专数据爬虫反爬虫 Python Java GO Scrapy 反反爬策略优化数据采集监控搭建多源电商数据采集

深圳东辰鑫科技有限公司玉溪市高仓农机加油站唐山市路南清真吃回面馆深圳市鸿鼎盛投资管理有限公司江西崇远人力资源有限公司芦溪分公司大连子俊百货商贸中心西安市雁塔区炬坤建材经销部河南安创企业管理有限责任公司霸州市丰尔五金电料经营部深圳市威通达科技有限公司

关于我们: 公司介绍; 联系我们; 诚聘英才

产品与服务: 人才招聘; 企业招聘

使用与帮助: 账号注销; 意见反馈; 发票制度; 防骗指南; 法律协议; 资质公示

智联招聘更懂你的价值

智联app小程序官方微信企业版APP

未经 Zhaopin.com 同意，不得转载本网站之所有招聘信息及作品智联招聘网版权所有

京ICP备12025925号京ICP证010207号

京公网安备 11010502059392号人力资源许可证:1101051996081号

网上有害信息举报专区违法不良信息举报电话:400-885-9898 关爱未成年举报热线:400-885-9898-3

朝阳区人力资源与社会保障局监督电话

网络110报警服务电子营业执照