工作职责:
1. 参与电力语音识别与合成、智能客服、调度语音交互等相关场景的规划、建设及硬件选型适配相关工作。
2. 负责语音数据处理、模型实验、前端测试等核心研发环节,聚焦语音识别与合成相关核心功能的研发与优化工作。
3. 参与语音识别、语音合成模型的研发与优化,保障语音识别与合成效果,确保相关核心功能顺利落地并稳定运行。
4. 协助多模态交互系统/项目的研发与调试,同时跟踪端到端语音识别、大模型语音理解等前沿技术,并完成工程化落地。
任职资格:
1. 硕士及以上学历,计算机科学与技术、人工智能、自动化、电子信息、软件工程、控制工程、模式识别、机器人工程等相关专业。
2. 具有3年以上语音算法研发经验。
3. 具体语音合成、语音识别、语音增强、音频分类等具体方向的算法研究与开发。
4. 熟悉相关核心技术链路与主流模型,例如语音合成领域的Tacotron、VITS系列模型,或语音识别领域的声学模型、语言模型及解码器。
5. 具备跟踪并推动前沿技术(如端到端模型、零样本/少样本生成、音频大模型)落地应用的能力。
6. 熟练掌握Python编程语言是普遍要求,同时常需掌握C/C++、Java、MATLAB中的至少一种。
7. 必须熟悉至少一种主流深度学习框架,如PyTorch或TensorFlow。
8. 了解多模态交互相关技术、前沿语音技术发展趋势,有相关技术积累者优先。