更新于今天

AI数据工程（反爬虫/ETL/LLM）

2-2.5万·13薪

上海浦东新区
5-10年
本科
全职
招1人

PythonDjangoFlaskMySQL爬虫LLMETL生物/制药

职位概述：
作为DS&AI团队的数据基石，你将负责构建一套能够支撑前沿AI模型与AI Agent运行的数据生态。你的核心任务是整合全球专业生物医药数据库，并利用大语言模型（LLM）从内外部海量文档中自动化提取关键科学信息，最终打造一个结构化、高性能、可被AI Agent高效调用以及训练AI模型的科学数据底座。
核心职责：
1. 科学数据整合与流水线建设：
· 专业库对接：负责从 ChEMBL, PubChem, UniProt等主流生物医药数据库中提取、解析并集成数据。
· ETL流程维护：设计并维护自动化的数据清洗、标准化流水线，处理实验数据（Assay Data）中的冗余与缺失，确保数据对AI模型的一致性。
· 数据质量监控：建立严谨的数据校验规则，确保整合后的科学数据在结构化程度和准确性上达到模型训练标准。
2. 多源数据采集与智能信息提取：
· 多维数据抓取：针对外部文献（PubMed, arXiv）、专利网站及行业动态，开发高效的自动化爬虫系统，作为标准库的数据补充。
· 内外部文档智能解析：利用 LLM和OCR技术，深度解析外部专利/论文及内部科研报告/实验记录等非结构化文档。
· 知识自动化：负责将提取出的零散信息转化为结构化数据，持续丰富企业内部的科学知识库。
3. AI Agent 数据底座建设：
· Agent 数据支撑：负责打造服务于 AI Agent 的数据基础设施，包括但不限于构建和维护结构化数据库，向量数据库 (Vector DB) 和图数据库 (Graph DB)。
· 工具接口开发：为 AI Agent 规划并开发标准化的一套数据查询工具，使其能够自主、精准地检索并调用底层科学数据。
任职要求：
· 教育背景：计算机、生物信息学、化学信息学、计算生物学或相关专业背景。
· 行业背景：
o 熟悉常用的生物医药数据库（如 ChEMBL, UniProt, PubChem 等）的数据组织逻辑。
o 对小分子结构、蛋白质序列等科学数据格式有基础了解。
· 编程与数据能力：
o 精通 Python，具备扎实的数据清洗（Pandas, NumPy）和 SQL 数据库操作能力。
o 具备网络爬虫开发经验（Scrapy, Selenium 等），能处理常规的反爬机制。
· AI 技术应用：
o 熟悉 LLM 应用开发（如使用过 OpenAI API, LangChain等框架进行信息提取或 RAG 开发）。
o 对 AI Agent 的工作原理有基本认知，并有志于探索其在科学领域的落地。
· 优秀的逻辑思维，出色的跨部门沟通能力，能够快速理解科研业务逻辑，并将其转化为高效的数据方案。

浦东新区映恩生物科技(上海有限公司)1

入职公司某科技公司

公司地址上海静安区

公司人数 1000-9999人

公司介绍

英特利普集团创立于2009年，是一家总部位于美国硅谷的顶尖人才生态管理咨询及人力资源解决方案供应商。22年营收过亿美金，服务包括：高端招聘，高端海外校招，雇主品牌搭建，企业业务咨询，国际化咨询等服务。

工商信息

企业名称英特利普（上海）信息技术有限公司

企业类型有限责任公司（自然人投资或控股）

法人代表詹昊鹏

经营状态存续

成立时间 2020-10-22

注册资本 3000万元

查看全部信息

营业执照信息人力资源服务许可证

1-2万软通动力信息技术(集团)股份有限公司

本科 3-5年 Linux Java C++ Python 半导体/芯片计算机软件通信/网络设备五险一金周末双休定期体检定期团建项目奖金节日福利带薪年假

1.2-2.4万外企德科数字技术有限公司

本科 Java C++ C 云计算软件/IT服务计算机软件

8000-12000元·13薪软通动力信息技术(集团)股份有限公司

本科 1-3年 PYTHON开发

1.5-3万·14薪外企德科数字技术有限公司

本科 Python C++ JavaScript Spring Mybatis MySQL Redis 人工智能产业互联网平台计算机软件

1.3-2万天源迪科

本科 1-3年人工智能云计算计算机软件

3-5.5万·15薪四川挽星企业管理咨询有限公司

本科 10年以上 Python PyQt Flask MySQL PostgreSQL Oracle 云计算人工智能物联网

1.4-1.9万深圳华云信息系统科技股份有限公司

本科 3-5年 Java MySQL Oracle Sql Python 基金证券/期货投资与资产管理五险一金

1-1.5万南京悦世耀科技有限公司

大专 1-3年计算机软件

面议 ABB

硕士 Java 工业机器人机器人

2-2.5万软通动力信息技术(集团)股份有限公司

本科 5-10年 AWS CDK 英语口语

面议中软国际

本科 1-3年 Python PYTHON后端 Django FLASK、FASTAPI REQUESTS、PANDAS NUMPY、OPENCV MYSQL、REDIS 多线程、协程 PYTHON开发自动化测试脚本 PYTHON后端服务新能源/燃油整车研发制造新能源/燃油车零部件导师帮带发展空间大五险一金年终奖弹性打卡工作技术培训节日礼品带薪假期人文关怀团建活动

1.5-3万·13薪光华教育集团

本科 5-10年 Python Django Flask MySQL PostgreSQL Redis pytorch 互联网教育产业互联网平台软件/IT服务

面议平安陆金所

本科

1.6-2万上海有大信息科技

本科 3-5年证券/期货

1.3-2.6万·14薪科锐尔人力资源服务(苏州)有限公司

本科 Python Java C++ 人工智能云计算计算机软件弹性工作健身房导师带教年终奖技术培训

1.5-1.8万软通动力信息技术(集团)股份有限公司

本科 3-5年 Java GO Django Flask Tornado MySQL PostgreSQL Oracle 云平台云计算产业互联网平台人工智能

1.2-2万立信会计师事务所（特殊普通合伙）

本科 1-3年 AI 爬虫基础应用开发计算机软件产业互联网平台信息安全

1.8-3.5万南京芷铭企业管理咨询有限公司

本科 Python PostgreSQL 人工智能计算机软件软件/IT服务

1.1-2.2万安科瑞

本科 Java C++ Sql Django Scrapy PyQt Oracle Redis SQLServer 仪器仪表工业自动化/机器人

1.2-1.9万北京众策科技咨询有限公司

本科 3-5年 Python AI 电商软件/IT服务计算机软件

1.3-2万上海均瑶世外教育科技(集团)有限责任公司

大专 3-5年 AI+教育计算机软件人工智能

2-3万上海纽卓医疗美容门诊部有限公司

本科 3-5年 Scrapy 人工智能

1.6-2.4万软通动力信息技术(集团)股份有限公司

本科 3-5年数字人直播 AI编程电商智能客服系统互联网电商互联网新零售

9000-16000元上海则龙信息科技有限公司

本科 3-5年 Python Flask Django FASTAPI MySQL PostgreSQL 3年以上PYTHON开发经验熟练 N8N 或类似工作流引擎熟悉AI/NLP API的调用自动化工作流开发工程师弹性工作

1.4-1.8万台州拜亚进出口有限公司

大专 1-3年 Django Flask MySQL Redis

1.3-1.5万上海微创软件股份有限公司

大专 3-5年 Python PYTHON开发 Django

面议中软国际

本科 1-3年 PYTHON开发 Django Flask MySQL Redis

2000-4000元河南九页科技有限公司

本科 Java Python MATLAB Django MySQL 深度学习机器学习计算机视觉软件/IT服务周结

2-2.5万·13薪英特利普(上海)信息技术有限公司

本科 5-10年 Python Django Flask MySQL 爬虫 LLM ETL 生物/制药

1.5-1.8万上海汉朔信息科技有限公司

本科 3-5年 Python 大模型银行证券/期货

1.5-3万步览捷信息科技(上海)有限公司

大专 5-10年 Django Java 计算机软件

1.5-2万博彦科技承德有限公司

本科 1-3年云计算

1.4-2.8万·14薪科锐尔人力资源服务(苏州)有限公司

本科 C++ Shell JavaScript Flask Scrapy Tornado PostgreSQL MongoDB Redis 计算机软件人工智能云计算早9晚6 团建弹性打卡班车导师带教带薪年假年度免费体检下午茶节假日礼品无加班周未双休加班双倍工资加班费

1.6-2.5万上海福迈迪工程技术有限公司

本科 3-5年云端基础架构

2.5-3.5万软通动力信息技术(集团)股份有限公司

本科 5-10年 Java MySQL AGENT AI 人工智能

1.8-2万博彦科技承德有限公司

本科 1-3年 Flask Python Django 量子计算

重庆弘关贸易有限公司达拉特旗一字格艺术培训有限公司温州观宇装饰有限公司金华市鑫泽运输有限公司天津市东丽区九零八五餐饮服务店望都康信隆丰商贸有限公司山东岳扬钢结构工程有限公司天津市宁河县爱丽诗情鲜花店立山区培森道路货物运输户双流区柯豪机械配件经营部

关于我们: 公司介绍; 联系我们; 诚聘英才

产品与服务: 人才招聘; 企业招聘

使用与帮助: 账号注销; 意见反馈; 发票制度; 防骗指南; 法律协议; 资质公示

智联招聘更懂你的价值

智联app小程序官方微信企业版APP

京ICP备12025925号京ICP证010207号

京公网安备 11010502059392号人力资源许可证:1101051996081号

网上有害信息举报专区违法不良信息举报电话:400-885-9898 关爱未成年举报热线:400-885-9898-3

朝阳区人力资源与社会保障局监督电话

网络110报警服务电子营业执照

AI数据工程（反爬虫/ETL/LLM）

职位描述

工作地点

入职公司信息

公司信息

公司介绍

工商信息

认证资质

相似职位

Python自动化测试

python后端开发工程师

python开发工程师

python开发工程师

AI 开发工程师

后端开发（python）

Python开发（国联民生）

Python开发

Intern-Lab Prototype SW Development原型开发

高级python后端开发工程师 英语口语

python开发工程师

Python后端开发工程师（在线教育平台）

2026届后端开发工程师

python开发（外包证券

python后端开发工程师（大厂 双休）

AI平台研发工程师

Python工程师 （J10563）

智能体开发工程师

Python后端软件工程师

Python开发（外企）

后端开发工程师

高级后端AI开发工程师

Python开发

自动化工作流开发工程师

中级后端开发工程师（AI Agent 编程方向）

python开发工程师

Python开发工程师

Python工程师(线上兼职)

AI数据工程（反爬虫/ETL/LLM）

Python开发工程师

对日软件开发工程师

量子软件开发工程师（全栈/后端）

后端开发工程师（接受转码 线上面试 早9晚6）

后端软件工程师-P00008

Agent开发工程师

量子软件开发工程师（全栈/后端）

高级python后端开发工程师英语口语

python后端开发工程师（大厂双休）

Python工程师（J10563）

后端开发工程师（接受转码线上面试早9晚6）