职位描述
大数据开发数据建模数据仓库云计算企业服务计算机软件
1、负责大模型训练数据制备全流程架构的整体规划与设计,结合大模型研发需求(如基座模型、行业大模型),搭建训练数据采集、清洗、标注、去重、脱敏、存储、流转的端到端架构体系,确保架构适配大模型训练的数据量级、质量要求及迭代效率。
2、深入对接算法研发团队,挖掘大模型训练数据的核心需求(如数据类型、规模、质量标准、格式要求),将算法需求转化为可落地的数据制备架构方案,推动数据制备架构与大模型训练流程、算法迭代的协同衔接。
3、主导大模型训练数据制备架构的落地推进,制定架构实施路线图,配合技术团队完成数据制备工具选型、链路部署、流程优化,解决落地过程中的架构适配、数据兼容、效率瓶颈等问题,确保架构落地效果符合大模型训练预期。
4、负责训练数据制备架构的迭代优化,跟踪大模型技术发展趋势、数据制备技术升级(如自动化标注、数据去重、隐私计算在训练数据中的应用),定期评估架构合理性与适配性,输出架构优化方案,提升数据制备效率、数据质量及架构可扩展性。
5、制定大模型训练数据制备相关规范、标准及流程(如数据质量标准、数据标注规范、数据安全合规规范),推动数据制备架构设计、落地、运维的标准化开展,指导团队成员开展数据制备架构相关工作,提升团队整体架构设计与数据治理能力。
6、对接数据供给方、标注团队、算法团队、安全团队,协调各方资源,推动跨部门协作,确保训练数据制备架构方案得到有效执行,保障大模型训练数据的持续供给与质量稳定。
2、深入对接算法研发团队,挖掘大模型训练数据的核心需求(如数据类型、规模、质量标准、格式要求),将算法需求转化为可落地的数据制备架构方案,推动数据制备架构与大模型训练流程、算法迭代的协同衔接。
3、主导大模型训练数据制备架构的落地推进,制定架构实施路线图,配合技术团队完成数据制备工具选型、链路部署、流程优化,解决落地过程中的架构适配、数据兼容、效率瓶颈等问题,确保架构落地效果符合大模型训练预期。
4、负责训练数据制备架构的迭代优化,跟踪大模型技术发展趋势、数据制备技术升级(如自动化标注、数据去重、隐私计算在训练数据中的应用),定期评估架构合理性与适配性,输出架构优化方案,提升数据制备效率、数据质量及架构可扩展性。
5、制定大模型训练数据制备相关规范、标准及流程(如数据质量标准、数据标注规范、数据安全合规规范),推动数据制备架构设计、落地、运维的标准化开展,指导团队成员开展数据制备架构相关工作,提升团队整体架构设计与数据治理能力。
6、对接数据供给方、标注团队、算法团队、安全团队,协调各方资源,推动跨部门协作,确保训练数据制备架构方案得到有效执行,保障大模型训练数据的持续供给与质量稳定。
岗位要求
1、本科及以上学历,计算机、大数据、人工智能、数据科学等相关专业,3-8年大模型训练数据制备、数据架构设计相关工作经验,有大型大模型(基座/行业)训练数据架构设计及落地经验者优先。
2、具备扎实的大模型训练数据制备架构设计能力,熟悉大模型训练数据全流程(采集、清洗、标注、去重、脱敏、存储),掌握架构设计方法与工具,能独立完成大模型训练数据制备架构规划、方案设计及落地推进。
3、熟悉大数据核心技术栈(Hadoop、Spark、Flink等)、数据存储架构(分布式存储、对象存储等)及数据制备工具(自动化标注工具、数据清洗工具等),理解大模型训练原理,能实现数据制备架构与大模型训练需求的精准适配。
4、具备较强的数据洞察力和需求分析能力,能深入理解大模型研发逻辑,快速捕捉算法团队的训练数据需求,解决数据制备过程中的质量、效率、合规等核心问题,输出合理的架构解决方案。
5、具备良好的沟通协调能力、逻辑思维能力和项目管理能力,能高效对接跨部门资源,推动架构方案落地,解决架构实施过程中的各类复杂技术与业务问题。
6、工作认真负责、具备战略思维和创新意识,较强的抗压能力、执行力和团队协作精神,有良好的文档撰写能力和方案宣讲能力,能输出专业的架构设计文档、实施方案等。
7、持有相关专业证书(如TOGAF、CDMP、大数据架构师、人工智能相关认证等)、有大模型训练数据合规管理经验、熟悉隐私计算在训练数据中的应用者优先录用。
2、具备扎实的大模型训练数据制备架构设计能力,熟悉大模型训练数据全流程(采集、清洗、标注、去重、脱敏、存储),掌握架构设计方法与工具,能独立完成大模型训练数据制备架构规划、方案设计及落地推进。
3、熟悉大数据核心技术栈(Hadoop、Spark、Flink等)、数据存储架构(分布式存储、对象存储等)及数据制备工具(自动化标注工具、数据清洗工具等),理解大模型训练原理,能实现数据制备架构与大模型训练需求的精准适配。
4、具备较强的数据洞察力和需求分析能力,能深入理解大模型研发逻辑,快速捕捉算法团队的训练数据需求,解决数据制备过程中的质量、效率、合规等核心问题,输出合理的架构解决方案。
5、具备良好的沟通协调能力、逻辑思维能力和项目管理能力,能高效对接跨部门资源,推动架构方案落地,解决架构实施过程中的各类复杂技术与业务问题。
6、工作认真负责、具备战略思维和创新意识,较强的抗压能力、执行力和团队协作精神,有良好的文档撰写能力和方案宣讲能力,能输出专业的架构设计文档、实施方案等。
7、持有相关专业证书(如TOGAF、CDMP、大数据架构师、人工智能相关认证等)、有大模型训练数据合规管理经验、熟悉隐私计算在训练数据中的应用者优先录用。
工作地点
北京朝阳区兆泰国际中心C座

认证资质
营业执照信息

更新于 4月23日





