职位描述:
1、搭建具有通用性和可拓展性的语音标注框架,与专家团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据;
2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效;
3、能按照训练需求进行数据标注、分析和验证调优,提升模型效果;
4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
职位要求:
1、本科及以上学历,研究生优先,3年以上互联网产品或运营营经验,语言学、计算语言学相关专业优先;
2、具备出色的PE能力,能够独立设计Prompt策略形成工作流,提高数据生产的质量和效率;
3、有访谈经验或陪伴聊天软件重度使用经验优先;对AI对话大模型有深度体验,具备高情商、拟人化、COT数据生产经验者优先;
4、对大模型、数据领域有深刻的理解和认知,具备大模型应用落地目关工作经验,有Agent搭建经验优先。
5、具备良好的沟通能力和抗压能力,能高效协调跨部门资源,面对突发问题能快速响应并提出有效解决方案