职位描述
语音处理人工智能
岗位职责:
1、负责四足机器狗车端语音交互系统的架构设计与算法研发,包括语音唤醒、语音识别、语义理解及语音合成等核心模块的开发与优化
2、主导语音交互算法在嵌入式平台的移植、部署与性能优化,确保在资源受限环境下实现低延迟、高精度的实时语音处理
3、构建多场景语音交互数据集,设计数据采集方案与标注流程,持续优化算法在噪声环境、远场交互等复杂条件下的鲁棒性
4、开发语音交互调试工具与可视化分析平台,支持交互链路各环节的性能测试与问题定位
5、协同感知、导航等算法团队,推动多模态交互技术融合,实现语音与视觉、运动控制的协同应用
6、跟踪语音交互前沿技术,推动端侧语音算法创新,优化功耗、响应速度及用户体验
7、制定语音交互测试标准与评估体系,完成算法性能评测与产品化验收
任职要求:
1、计算机科学、信号处理、人工智能等相关专业本科及以上学历
2、3年以上语音算法开发经验,具备端侧语音交互系统落地经验,熟悉嵌入式AI部署流程
3、精通语音信号处理、深度学习语音算法,熟悉Kaldi、ESPnet、WeNet等开源工具框架
4、熟悉嵌入式平台(如ARM Cortex-A/M系列)的算法优化技术,掌握NEON指令集、模型量化剪枝等加速方法
5、具备C++/Python开发能力,熟悉Linux开发环境及ROS/ROS2机器人开发框架
6、具备较强的问题分析与解决能力,能独立完成算法调试与性能优化
7、有机器人、智能硬件语音交互项目经验者优先,熟悉多模态交互技术者优先
1、负责四足机器狗车端语音交互系统的架构设计与算法研发,包括语音唤醒、语音识别、语义理解及语音合成等核心模块的开发与优化
2、主导语音交互算法在嵌入式平台的移植、部署与性能优化,确保在资源受限环境下实现低延迟、高精度的实时语音处理
3、构建多场景语音交互数据集,设计数据采集方案与标注流程,持续优化算法在噪声环境、远场交互等复杂条件下的鲁棒性
4、开发语音交互调试工具与可视化分析平台,支持交互链路各环节的性能测试与问题定位
5、协同感知、导航等算法团队,推动多模态交互技术融合,实现语音与视觉、运动控制的协同应用
6、跟踪语音交互前沿技术,推动端侧语音算法创新,优化功耗、响应速度及用户体验
7、制定语音交互测试标准与评估体系,完成算法性能评测与产品化验收
任职要求:
1、计算机科学、信号处理、人工智能等相关专业本科及以上学历
2、3年以上语音算法开发经验,具备端侧语音交互系统落地经验,熟悉嵌入式AI部署流程
3、精通语音信号处理、深度学习语音算法,熟悉Kaldi、ESPnet、WeNet等开源工具框架
4、熟悉嵌入式平台(如ARM Cortex-A/M系列)的算法优化技术,掌握NEON指令集、模型量化剪枝等加速方法
5、具备C++/Python开发能力,熟悉Linux开发环境及ROS/ROS2机器人开发框架
6、具备较强的问题分析与解决能力,能独立完成算法调试与性能优化
7、有机器人、智能硬件语音交互项目经验者优先,熟悉多模态交互技术者优先
工作地点
杭州余杭区浙江海外高层次人才创新园文一西路998号

认证资质
营业执照信息

更新于 5月15日




