更新于 4月23日

大数据技术架构师(模型训练方向)

3.5-5万
  • 北京 朝阳区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

大数据开发数据建模数据仓库云计算企业服务计算机软件
1、负责大模型训练数据制备全流程架构的整体规划与设计,结合大模型研发需求(如基座模型、行业大模型),搭建训练数据采集、清洗、标注、去重、脱敏、存储、流转的端到端架构体系,确保架构适配大模型训练的数据量级、质量要求及迭代效率。
2、深入对接算法研发团队,挖掘大模型训练数据的核心需求(如数据类型、规模、质量标准、格式要求),将算法需求转化为可落地的数据制备架构方案,推动数据制备架构与大模型训练流程、算法迭代的协同衔接。
3、主导大模型训练数据制备架构的落地推进,制定架构实施路线图,配合技术团队完成数据制备工具选型、链路部署、流程优化,解决落地过程中的架构适配、数据兼容、效率瓶颈等问题,确保架构落地效果符合大模型训练预期。
4、负责训练数据制备架构的迭代优化,跟踪大模型技术发展趋势、数据制备技术升级(如自动化标注、数据去重、隐私计算在训练数据中的应用),定期评估架构合理性与适配性,输出架构优化方案,提升数据制备效率、数据质量及架构可扩展性。
5、制定大模型训练数据制备相关规范、标准及流程(如数据质量标准、数据标注规范、数据安全合规规范),推动数据制备架构设计、落地、运维的标准化开展,指导团队成员开展数据制备架构相关工作,提升团队整体架构设计与数据治理能力。
6、对接数据供给方、标注团队、算法团队、安全团队,协调各方资源,推动跨部门协作,确保训练数据制备架构方案得到有效执行,保障大模型训练数据的持续供给与质量稳定。
岗位要求
1、本科及以上学历,计算机、大数据、人工智能、数据科学等相关专业,3-8年大模型训练数据制备、数据架构设计相关工作经验,有大型大模型(基座/行业)训练数据架构设计及落地经验者优先。
2、具备扎实的大模型训练数据制备架构设计能力,熟悉大模型训练数据全流程(采集、清洗、标注、去重、脱敏、存储),掌握架构设计方法与工具,能独立完成大模型训练数据制备架构规划、方案设计及落地推进。
3、熟悉大数据核心技术栈(Hadoop、Spark、Flink等)、数据存储架构(分布式存储、对象存储等)及数据制备工具(自动化标注工具、数据清洗工具等),理解大模型训练原理,能实现数据制备架构与大模型训练需求的精准适配。
4、具备较强的数据洞察力和需求分析能力,能深入理解大模型研发逻辑,快速捕捉算法团队的训练数据需求,解决数据制备过程中的质量、效率、合规等核心问题,输出合理的架构解决方案。
5、具备良好的沟通协调能力、逻辑思维能力和项目管理能力,能高效对接跨部门资源,推动架构方案落地,解决架构实施过程中的各类复杂技术与业务问题。
6、工作认真负责、具备战略思维和创新意识,较强的抗压能力、执行力和团队协作精神,有良好的文档撰写能力和方案宣讲能力,能输出专业的架构设计文档、实施方案等。
7、持有相关专业证书(如TOGAF、CDMP、大数据架构师、人工智能相关认证等)、有大模型训练数据合规管理经验、熟悉隐私计算在训练数据中的应用者优先录用。

工作地点

工作地点
北京朝阳区兆泰国际中心C座
位置图标
完善简历

公司信息

北京集成中服技术服务有限公司

不需要融资 · 1000-9999人 · 软件/IT服务 已审核 已审核

32 个在招职位

工商信息

企业名称 北京集成中服技术服务有限公司
企业类型 有限责任公司(自然人独资)
法人代表 李春玲
经营状态 存续
成立时间 2012-11-26
注册资本 6800万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

数据中台技术经理

2.3-4万 国家电投集团数字科技有限公司
本科 5-10年 数据仓库 数据治理 数据库开发 云计算

数据治理-全额社保/统招本

2-3万 软通动力信息技术(集团)股份有限公司
本科 5-10年 数据治理 供应链 建筑/土木/市政设计 工程施工 工程专业服务 全额社保

AIGC管线技术指导

1.8-2.2万 启润科技咨询(重庆)有限公司
大专 1-3年 数据治理 数据建模 广播/电视/影视 工程技术与设计服务 底薪加提成

数据治理工程师

2.5-3万·13薪 北京晶澳太阳能光伏科技有限公司
本科 5-10年 数据治理 数据库开发 数据仓库 新能源
最新招聘
热门城市
热门职位
热门公司