职位描述
数据治理数据挖掘数据建模
岗位职责:
1. 负责探索大模型数据合成增强算法、数据蒸馏模型、强化学习等前沿数据工程技术;
2. 负责开发数据合成工具,数据清洗Pipeline核心算法开发,实现大规模数据的智能清洗、分类与质量评估,
3. 负责数据集构建与管理,设计和构建大模型训练/推理所需的数据集,建立数据质量管控系统;
4. 与训练、推理团队协作,构建数据-训练-推理全链路融合系统
任职要求:
1. 3年以上相关工作经验,扎实的Python编程基础,熟练运用数据科学核心工具栈,熟悉常见数据集格式与协议,熟悉高质量数据集的构建;
2. 熟悉Claude Code,Codex等AI编码工具与prompt工程技巧;
3. 掌握大模型领域的数据合成、模型蒸馏、数据增强技术,熟悉数据处理库、工作流引擎、数据版本管理,熟悉数据中4.具备LLM项目经验,深入了解模型训练数据处理完整流程-有数据质量算法设计与优化经验,拥有多模态数据处理业务背景(自动化标注、图像理解、OCR等)
1. 负责探索大模型数据合成增强算法、数据蒸馏模型、强化学习等前沿数据工程技术;
2. 负责开发数据合成工具,数据清洗Pipeline核心算法开发,实现大规模数据的智能清洗、分类与质量评估,
3. 负责数据集构建与管理,设计和构建大模型训练/推理所需的数据集,建立数据质量管控系统;
4. 与训练、推理团队协作,构建数据-训练-推理全链路融合系统
任职要求:
1. 3年以上相关工作经验,扎实的Python编程基础,熟练运用数据科学核心工具栈,熟悉常见数据集格式与协议,熟悉高质量数据集的构建;
2. 熟悉Claude Code,Codex等AI编码工具与prompt工程技巧;
3. 掌握大模型领域的数据合成、模型蒸馏、数据增强技术,熟悉数据处理库、工作流引擎、数据版本管理,熟悉数据中4.具备LLM项目经验,深入了解模型训练数据处理完整流程-有数据质量算法设计与优化经验,拥有多模态数据处理业务背景(自动化标注、图像理解、OCR等)
工作地点
南京玄武区玄武大道699号-18号19栋

工作地点

公司信息
国机数字科技有限公司
未融资 · 300-499人 · 人工智能
已审核
工商信息
企业名称 国机数字科技有限公司
企业类型 有限责任公司(非自然人投资或控股的法人独资)
法人代表 王宇航
经营状态 存续
成立时间 2023-08-09
注册资本 4.5亿元
认证资质
营业执照信息
相似职位
查看更多Hadoop

本科
3-5年
Hadoop
Spark
数据仓库
大数据集群运维
性能调优
数据安全保障
数据挖掘
数据架构
Python
Scala
Shell
Storm
实时大数据开发工程师
7000-8000元 软通动力信息技术(集团)股份有限公司
本科
1-3年
数据治理
数据仓库
Java
Scala
Python
Flink
Spark
实时数据管道开发
流批一体架构设计
数据质量监控
最新招聘
热门城市
热门职位
热门公司
竹山县中商物流有限公司
唐山市丰南区丰南镇地摊烤肉店
天阳胜合科技(北京)有限公司
无极县云辉手工挂面加工部
北京玫瑰情园露营地服务有限公司
广西光大旅游投资有限公司桂平马皮门市部
尤溪县坂兜林业专业合作社
新泰市瑞春堂医药有限公司为诚医药商场
定西恒亮彩钢钢结构有限责任公司
红蚂蚁家(北京)装饰工程有限公司潼关分公司
吐鲁番招聘
北海招聘
新乡招聘
恩施招聘
塔城招聘
葫芦岛招聘
嘉峪关招聘
庆阳招聘
咸宁招聘
阜新招聘
白山招聘
果洛招聘
兰州招聘
北京招聘
天津招聘
淮北招聘
桂林招聘
怀化招聘
九江招聘
肇庆招聘

更新于 1月9日


