职位描述
图像算法
职位描述:
1. 负责多语种(西班牙语、葡萄牙语、俄语、阿拉伯语、马来语、他加禄语、越南语)训练数据全流程管理,辅助搭建符合各语种特性的标注框架与质量标准,对齐专家/算法团队需求,确保数据适配大模型训练场景。 2. 统筹核心标注团队,主导多语种数据生产、预处理、标注、校验全链路推进,以质量&进度为导向,保证训练数据的交付预期。 3. 搭建多语种数据自动化生产链路,通过 PE 工具、代码工具优化数据处理效率,开展数据质量评估与分析调优,提升数据准确率、完整性与多样性。 4. 建立多语种数据生产协作机制,跨团队同步数据进度与质量情况,沉淀语种适配经验与数据处理方法论,形成可复用的标准流程
职位要求:
1、本科及以上学历,语言类、计算机类、数据科学类相关专业优先,具备 3 年以上多语种数据处理或大模型数据生产相关工作经验。 2、精通至少 1 门上述小语种,拥有C1证书(或同等水平语言证明)或是该语言的母语者,2-3 种其他语种的基本语言学认识,能独立完成本语种数据质量校验与标准制定。英文可作为工作语言,听说能力佳,可以和国外native用英文沟通需求、撰写英文文档。 3、熟悉大语言模型训练数据生产逻辑,掌握数据标注、预处理、质量评估的核心方法,具备搭建多语种数据生产框架的实操能力。 4、具备优秀的统筹协调与跨团队沟通能力,能带领团队高效推进多语种数据生产任务,擅长解决不同语种的差异化协作问题。
1. 负责多语种(西班牙语、葡萄牙语、俄语、阿拉伯语、马来语、他加禄语、越南语)训练数据全流程管理,辅助搭建符合各语种特性的标注框架与质量标准,对齐专家/算法团队需求,确保数据适配大模型训练场景。 2. 统筹核心标注团队,主导多语种数据生产、预处理、标注、校验全链路推进,以质量&进度为导向,保证训练数据的交付预期。 3. 搭建多语种数据自动化生产链路,通过 PE 工具、代码工具优化数据处理效率,开展数据质量评估与分析调优,提升数据准确率、完整性与多样性。 4. 建立多语种数据生产协作机制,跨团队同步数据进度与质量情况,沉淀语种适配经验与数据处理方法论,形成可复用的标准流程
职位要求:
1、本科及以上学历,语言类、计算机类、数据科学类相关专业优先,具备 3 年以上多语种数据处理或大模型数据生产相关工作经验。 2、精通至少 1 门上述小语种,拥有C1证书(或同等水平语言证明)或是该语言的母语者,2-3 种其他语种的基本语言学认识,能独立完成本语种数据质量校验与标准制定。英文可作为工作语言,听说能力佳,可以和国外native用英文沟通需求、撰写英文文档。 3、熟悉大语言模型训练数据生产逻辑,掌握数据标注、预处理、质量评估的核心方法,具备搭建多语种数据生产框架的实操能力。 4、具备优秀的统筹协调与跨团队沟通能力,能带领团队高效推进多语种数据生产任务,擅长解决不同语种的差异化协作问题。
工作地点
北京市-海淀区-中关村大街11号1

入职公司信息
入职公司 北京字跳网络技术有限公司
公司地址 北京海淀区北京市海淀区中关村南四街18号紫金数码园
公司人数 10000人以上
公司信息
公司介绍
外企德科数字技术有限公司是一家2023年新成立的中外合资企业。成立于2023年11月24日,公司定位:专注于为信息技术企业提供人才及数字技术外包解决方案的中外合资企业。 它是由中国人力资源服务行业的FESCO(北京国际人力资本集团)与全球人力资源服务领导者The Adecco Group(德科集团)合资成立的。 公司主要提供网络技术服务、软件外包服务、计算机系统服务、技术进出口、软件开发等信息技术相关服务。专注于为信息技术企业提供信息技术类人才及数字技术外包解决方案。
工商信息
企业名称 外企德科数字技术有限公司
企业类型 有限责任公司(港澳台投资、非独资)
法人代表 宋菲菲
经营状态 存续
成立时间 2023-11-24
注册资本 5000万元
认证资质
营业执照信息 劳务派遣经营许可认证

更新于 今天






