更新于 今天

AI数据采集(爬虫)

1.1-1.5万
  • 杭州 余杭区
  • 1-3年
  • 本科
  • 全职

职位描述

数据爬虫Python产业互联网平台
岗位职责
1. 负责互联网公开数据的采集、清洗、结构化与入库,支撑 AI 应用、模型训练、知识库和数据分析业务。设计并开发高稳定性的爬虫系统,包括网页解析、动态页面采集、反爬策略应对、任务调度、代理管理和异常监控。
2. 针对不同网站结构,构建可复用的数据抽取规则和自动化解析流程,提升采集效率和数据质量。
3. 参与数据治理工作,包括去重、字段标准化、质量校验、数据溯源和更新机制设计。
4. 与算法、产品和业务团队协作,理解 AI 场景下的数据需求,输出可用于 RAG、训练、评测或业务分析的数据集。
5. 跟踪大模型、Agent、智能解析、网页理解等技术,探索 AI 辅助爬虫和自动化数据采集方案。
6. 遵守数据合规要求,确保采集范围、使用方式和存储流程符合相关法律法规及网站规则。
任职要求
1. 本科及以上学历,计算机、软件工程、数据科学等相关专业优先。
2. 熟练掌握 Python,熟悉 Scrapy、Requests、BeautifulSoup、Playwright、Selenium 等爬虫和浏览器自动化工具。
3. 熟悉 HTML、CSS、JavaScript、网络协议、浏览器渲染机制,能独立分析网页结构和接口请求。
4. 熟悉常见反爬机制及应对思路,如验证码、动态渲染、签名参数、频控、IP 限制、登录态管理等。
5. 熟悉 MySQL、PostgreSQL、MongoDB、Elasticsearch、Redis 中至少一种数据存储或检索系统。
6. 具备良好的数据清洗、文本处理和结构化能力,能处理多源异构数据。
7. 了解大模型、RAG、向量数据库、Embedding 或 AI 数据工程相关概念者优先。
8. 具备较强的问题排查能力、工程稳定性意识和合规意识。

工作地点

工作地点
杭州余杭区阿里巴巴西溪C区
位置图标
完善简历

公司信息

小葱(江苏)信息科技股份有限公司

未融资 · 20-99人 · 软件/IT服务 已审核 已审核

26 个在招职位

工商信息

企业名称 小葱(江苏)信息科技股份有限公司
企业类型 股份有限公司(非上市、自然人投资或控股)
法人代表 戴蕾
经营状态 存续
成立时间 2019-09-20
注册资本 2000万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

数据采集员

5000-10000元 铁岭枫途人力资源有限公司
大专 在校大学生兼职、居家办公 师范大学 大学生 线上兼职

数据采集

5000-6000元 杭州壹锐科技有限公司
本科 1-3年 人工智能 计算机软件 物联网 产业互联网平台 计算机硬件 电气机械/电力设备

会说杭州话就行 居家兼职 结算靠谱

40-60元/时 四川天贤途人力资源有限公司成都锦江分公司
无经验限制 居家兼职 不限时间地点 时间自由安排

舱内数据采集+周末双休

6000-7000元 浙江爱才人力资源股份有限公司
大专 数据爬虫 ADB命令 数据采集 抗压能力强 舱内数据采集 接受加班 周末双休 无责底薪 加班费 节假日3倍 社保

数据采集

5000-6000元 杭州壹锐科技有限公司
本科 1-3年 数据埋点 数据抽取 场景交互数据 视觉图像采集 运动控制数据 语音采集 传感器数据 工业自动化/机器人 人工智能 产业互联网平台

手机数据采集(双休)

5000-6000元 爱才集团有限公司
大专 1-3年 数据采集 数据标注 手机测试 云计算 计算机软件 产业互联网平台 早九晚六 周末双休

数据采集工程师

1.7-2万 小葱(江苏)信息科技股份有限公司
本科 3-5年 数据爬虫 数据埋点 数据抽取 反爬虫 分布式爬虫 Python 软件/IT服务

AI数据采集(爬虫)

1.1-1.5万 小葱(江苏)信息科技股份有限公司
本科 1-3年 数据爬虫 Python 产业互联网平台
最新招聘
热门城市
热门职位
热门公司