职位描述:
1、深度参与语音大模型的构建,搭建具有通用性和扩展性的大模型数据生产、评测体系,与产品算法团队协同完成TTS方向的自研探索与业务落地
2、理解业务需求,完成复杂标注任务的设计/标注/质检任务,协同技术和标注团队,推动需求顺利落地;
3、大语言模型训练过程中各阶段数据质量评估,确保大语言模型训练数据有效;制定产品和项目流程机制,协调项目各个角色高效工作;
4、统筹核心标注团队,主导中文/方言数据生产、预处理、标注、校验全链路推进;以数据质量与生产效率为导向,通过PE&Agent等形式完成数据清洗与分析,推动项目目标达成
职位要求:
1、本科及以上学位,语言学、语音学、计算语言学、语用学、心理学、汉语言等相关专业优先
2、1年以上语音数据相关工作经验(语音合成-中文方言优先),熟悉音视频创作、智能语音交互场景,有大语言模型相关的科研项目或工作经历者优先:
3、较强的分析和沟通能力,擅长从评估数据中发现有价值的产品改善建议,并能推动落地,有大语言模型任务设计和标注的科研或工作经历者优先,有语义学或语用学、语音学或音系学研究经历者优先
4、具备良好的沟通能力和文档撰写能力,能够清晰地表达观点和撰写专业报告,有较强的学习能力,能够快速掌握新知识、新技能,适应快速发展的行业环境。
薪资待遇:具体根据过往能力面试定薪,包三餐,入职五险一金