更新于 12月27日

语音大模型数据运营专家(TTS方向)

1-1.4万
  • 北京海淀区
  • 中关村
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

TTS语音评测
职位描述
牵头多语种(西班牙语、葡萄牙语、俄语、阿拉伯语、马来语、他加禄语、越南语)训练数据全流程管理,搭建符合各语种特性的标注框架与质量标准,对齐专家/算法团队需求,确保数据适配大模型训练场景。
统筹核心标注团队,主导多语种数据生产、预处理、标注、校验全链路推进,解决不同语种在表达习惯、文化适配等方面的差异化问题。
搭建多语种数据自动化生产链路,通过 PE 工具、代码工具优化数据处理效率,开展数据质量评估与分析调优,提升数据准确率、完整性与多样性。
协同算法、产品团队跟踪大模型技术进展,探索多语种智能数据生产模式,结合各语种使用场景迭代数据生产方案,支撑模型多语种能力优化。
建立多语种数据生产协作机制,跨团队同步数据进度与质量情况,沉淀语种适配经验与数据处理方法论,形成可复用的标准流程。
职位要求
本科及以上学历,语言类、计算机类、数据科学类相关专业优先,具备 3 年以上多语种数据处理或大模型数据生产相关工作经验。
精通至少 1 门上述小语种,或是该语言的母语者,2-3 种其他语种的基本语言学认识,能独立完成本语种数据质量校验与标准制定。英文可作为工作语言,听说能力佳,可以和国外native用英文沟通需求、撰写英文文档。
熟悉大语言模型训练数据生产逻辑,掌握数据标注、预处理、质量评估的核心方法,具备搭建多语种数据生产框架的实操能力。
具备基础的代码能力(如 Python)或 PE 工具使用经验,能通过技术手段优化多语种数据处理效率,有自动化数据生产链路搭建经验者优先。
具备优秀的统筹协调与跨团队沟通能力,能带领团队高效推进多语种数据生产任务,擅长解决不同语种的差异化协作问题。
了解各目标语种的使用区域特性与表达习惯,对大语言模型多语种能力优化有一定认知,具备较强的问题解决能力与迭代思维。

工作地点

北京海淀区e世界财富中心

职位发布者

李颖/招聘专员

今日活跃
立即沟通
公司Logo大连斯锐信息技术有限公司
大连斯锐是一家专注于信息技术及软件外包服务的提供商,致力于向客户提供数字化转型及信息技术服务。公司以客户服务为导向,通过创新及技术服务能力,为各行业客户提供解决方案及端到端的一体化流程服务,快速响应客户需求,实现高效及优质的交付,解决客户业务痛点,帮助客户快速实现业务目标及数字化转型。凭借多年的信息科技及IT服务行业经验以及渊厚知识,目前在中国已为超过160名客户提供专业的信息技术及IT人才服务,业务涵盖逾80个城市,并有近4000名软件开发与技术服务人员。
公司主页