更新于 2月10日

语音算法架构师

3-6万
  • 长沙长沙县
  • 经验不限
  • 硕士
  • 全职
  • 招1人

职位描述

语音处理语音降噪TTS人工智能
岗位职责:
1、核心语音引擎研发: 负责公司 AI 核心能力中台的语音技术模块研发,主导语音识别(ASR)、语音合成(TTS)、声纹识别(VPR)及语音信号处理等核心算法的研发、迭代与性能优化;
2、金融场景深度优化: 针对银行网点、远程银行、线上客服等金融特有场景(如强噪声、多口音、高回声环境),设计并实现鲁棒性更强的语音识别与增强模型,确保障碍沟通场景下的高可用性;
3、赋能数智人与智能交互: 为公司的核心产品 “3D 数智人” 提供语音交互的全栈技术支持,包括高表现力、情感化的语音合成(TTS),以及高精度的远场语音识别与声源定位,打造流畅、自然的金融服务对话体验;
4、声纹技术应用落地: 研发并应用声纹识别技术,构建金融级的声纹认证与反欺诈系统。探索其在用户身份核验、交易风险预警、黑名单声纹库比对等场景的创新应用;
5、智能质检与风控支持: 将语音识别(ASR)与自然语言处理(NLP)技术结合,支持金融服务录音的智能质检、合规监控、客户情绪分析及关键信息提取,为风险控制和营销分析提供数据支持;
6、平台化与工程落地: 负责语音算法的模型优化(量化、剪枝)、推理加速及服务化封装,确保模型在云端与边缘端(如金融机具)的高效部署;推动算法与国产信创软硬件(如昇腾、海光)的适配与调优;
7、前沿技术探索: 持续跟踪语音与音频领域的前沿技术(如端到端模型、跨语种识别、AI 降噪等),并将有价值的技术引入到实际业务场景中,保持公司在金融语音技术领域的领先性。
任职要求:
1、 硕士及以上学历,计算机科学、信号处理、声学、人工智能、电子信息工程等相关专业;
2、具备主导至少一个大型语音识别、语音合成或声纹识别项目从研发到成功上线的完整经验;
3、精通语音识别(ASR)、语音合成(TTS)、声纹识别(VPR)、语音唤醒(KWS)、语音增强(降噪/回声消除/去混响)等领域的核心算法原理,对 Conformer、U2/U2++、WeNet 等先进模型架构有深入理解和实践经验;
4、 精通 Python/C++,具备优秀的软件工程能力;熟练掌握 PyTorch/TensorFlow 等深度学习框架,并熟悉 Kaldi、ESPnet 等开源语音工具集;
5、 具备丰富的模型性能优化经验,熟练掌握模型量化、剪枝、蒸馏等技术。熟悉 ONNX、TensorRT、NCNN 等推理引擎,并有实际部署优化项目经验;
6、 具备扎实的数字信号处理理论基础,熟悉麦克风阵列信号处理(波束成形、声源定位)技术者优先;
7、了解国产 AI 算力平台(如华为昇腾、海光 DCU)的技术特性,有相关平台模型迁移、适配和性能调优经验者优先;
8、 具备优秀的分析和解决问题能力,能将复杂的金融业务需求转化为具体的技术方案;拥有良好的团队协作精神和沟通能力,能主动推动项目落地;
9、有金融科技、银行 IT、智能客服、安防或车载语音系统相关行业背景者优先;有处理金融场景下复杂噪声、强口音数据经验者优先。

工作地点

长沙长沙县长城信息股份有限公司

职位发布者

陈先生/招聘经理

三日内活跃
立即沟通
公司Logo长城信息股份有限公司
长城信息股份有限公司(简称长城信息)坐落于长沙经济技术开发区,是中国电子旗下中国长城的控股子公司。公司注册资金6.28亿元,占地面积122亩,集安全高端金融机具、数字化渠道系统解决方案、文印外设的研发、生产、销售和服务于一体,是国内金融信息化和信创办公信息化领域有影响力的解决方案提供商和设备供应商。
公司主页