该职位已失效,看看其他机会吧

AI语音通话对接工程师

1.1-1.3万
  • 北京朝阳区
  • 呼家楼
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

语音处理语音增强IT服务人工智能
语音通信系统架构设计与实现
1.负责基于SIP/WebRTC协议的电话软交换系统开发,实现运营商PSTN线路与AI系统的双向语音流对接
2.设计并落地语音活动检测(VAD)算法优化方案,将语音端点检测延迟控制在300ms以内,误触发率低于5%
3.构建支持500+并发通话的媒体服务器集群,实现负载均衡与故障自动切换(Failover)
实时语音处理Pipeline开发
1.集成ASR(语音识别)引擎,优化流式识别接口,实现首字返回时间(First Word Latency)≤800ms,字准率(WER)≤15%
2.负责TTS(语音合成)服务调优,基于情感合成技术实现多音色动态切换,MOS评分(语音自然度)≥4.0
3.开发双讲检测(Double-Talk
Detection)与回声消除(AEC)模块,确保嘈杂环境下的通话质量
大模型实时交互协议设计
1.设计LLM与语音系统的异步通信协议,实现Streaming响应与语音合成的无缝衔接,端到端延迟≤2s
2.开发对话状态管理(Dialog State
Tracking)模块,支持打断恢复、上下文继承与多轮对话管理
3.实现基于WebSocket的实时信令传输,确保信令到达率99.99%
通话质量监控与运维体系
1.构建通话质量指标体系(MOS、Jitter、Packet Loss、Latency),搭建实时监控大盘
2.设计异常通话自动诊断系统,实现ASR失败、TTS超时、网络抖动等问题的分钟级定位
3.制定容灾预案,确保单点故障时通话不中断,全年可用性≥99.95%
性能优化与成本控制
1.优化ASR/TTS调用策略,通过语音缓存、结果复用等手段降低API调用成本30%+
2.实现智能断句与语义预判,减少无效ASR请求量,提升系统吞吐量至1000 TPS
任职要求:
硬性条件
1. 计算机相关专业本科及以上学历,3年以上实时音视频或通信系统开发经验
2. 精通Python/Go/C++至少一种,熟悉GStreamer、FFmpeg等音视频处理框架
3. 深入理解SIP、RTP/RTCP、WebRTC协议栈,有FreeSWITCH、Kamailio、Asterisk等开源软交换平台二次开发经验
4. 熟悉常见ASR(阿里云、腾讯云、科大讯飞)与TTS引擎的API集成与性能调优
5. 具备高并发系统设计经验,熟悉Redis、Kafka、gRPC等中间件,有K8s容器化部署经验
加分项
1、 熟悉LLM推理优化技术(vLLM、TensorRT-LLM、Streaming生成)
2、 有电信级呼叫中心(Contact Center)或智能外呼系统开发经验
3、 掌握语音信号处理基础算法(降噪、增益控制、静音检测)
4、 了解VoIP网络QoS保障机制,有运营商线路对接经验
查看全部

工作地点

北京朝阳区财富中心三期财富金融中心58层

职位发布者

刘然/行政

刚刚活跃
立即沟通
公司Logo道可特国际物流(北京)有限公司
道可特国际物流(北京)有限公司成立于2004年,注册资金15001万元,是经国家商务部及国家交通部批准的具有无船承运业务经营资格的一级货运代理公司,主要承接大型项目、专项贸易的货运业务,构建了以海运散杂货为核心、综合性服务为延伸的国际贸易多式联运物流服务体系。道可特物流融汇物流、法律、保险专业知识,为客户设计、实施一站式的综合性物流方案。海运集散杂货船、特种集装箱运输于一体;陆运专注重大件、危险品等特种运输服务;空运擅长精密仪器和设备运输。道可特货运提供订舱、积载、报关报检、装卸、吊装、仓储分拨、中转、货物跟踪和管理等全套服务,同时前瞻性地设计从经济型至框架型的各种保险方案,降低事故风险。近十年的发展中,道可特物流不断探求国际化运作模式和专业化服务机制,形成了全面的服务网络和体系,在天津、上海、深圳、青岛、广州、连云港、宁波等国内战略港口,以及东南亚、中东、非洲、南北美等境外关键口岸铺设了完善的物流服务网络。
公司主页