更新于 3月25日

Ai infra

3.5-6万
  • 深圳福田区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

语音处理PyTorchPython人工智能
岗位职责:
1. 负责语音模型(ASR/TTS)推理全链路优化,基于 sherpa-onnx、TensorRT、ONNX Runtime、Triton 等主流推理框架,设计高吞吐、低延迟、高可用的推理服务方案,支撑大规模语音交互场景落地。
2. 主导推理性能瓶颈分析与优化,涵盖模型量化、剪枝、算子融合、批处理策略设计等,提升 GPU/CPU 资源利用率,保障推理服务在高并发场景下的稳定性与响应速度。
3. 参与语音数据处理与推理服务一体化平台搭建,联动数据工程链路,优化推理数据输入格式、批量调度逻辑,支撑 ASR/TTS 模型迭代与大规模训练后的推理部署需求。
4. 持续跟踪行业前沿推理优化技术与工具链,探索合成数据在推理性能优化中的应用,推动推理服务自动化调优、动态资源调度等创新方向落地。
任职要求:
1. 本科及以上学历,计算机、机器学习、自动化、数据科学等相关专业,具备 1-3 年语音模型(ASR/TTS)推理优化或深度学习工程化落地经验。
2. 精通 Python 编程,熟悉 PyTorch 等主流深度学习框架,深入理解至少一种语音推理框架(sherpa-onnx/TensorRT/ONNX Runtime/Triton)的底层原理与优化方法,掌握模型量化(INT8/FP16)、剪枝、算子优化、批处理策略等推理加速技术,有实际语音模型推理性能提升案例者优先,有在昇腾NPU上做过语音模型适配经验者优先。
3. 具备良好的工程落地能力、问题排查能力与跨团队沟通协作能力,有自驱力,能主动跟踪行业技术趋势并应用于实际工作。
4. 有开源推理优化项目贡献、大规模语音推理服务搭建或性能优化经验者优先。

工作地点

深圳福田区长富金茂大厦-1号楼57

入职公司信息

  • 入职公司: 某互联网公司
  • 公司地址: 北京朝阳区
  • 公司人数: 1000-9999人

认证资质

营业执照信息 人力资源服务许可认证

职位发布者

李诗晨/HRBP

当前在线
立即沟通
公司Logo锐仕方达人才科技集团有限公司
锐仕方达人才科技集团有限公司(简称“锐仕方达”),2008年在北京创立,是以技术驱动的一站式人力资源解决方案供应商,也是AAAA级人力资源服务机构。目前,锐仕方达在中国、英国伦敦、柬埔寨金边、日本、新加坡等全球70多座城市设有170余家分公司,拥有5000余名员工,为客户提供核心人才招聘、人才测评、校园招聘、RPO、背景调查等全方位人力资源服务。锐仕方达独创的“CPM合伙人机制”(Risfond Cross-Partner Models)成为人力资源服务行业极具竞争优势的利益分配模式。锐仕方达自主研发的“RNSS系统”(Risfond Network Search System)已成为业内领先的IT信息管理系统。截至目前,已有超过50000家国内外知名企业选择锐仕方达招募精英,助力70000+海内外人才职业成长。作为中国人力资源服务行业第一家利用互联网思维来经营人力资源服务业务的创新型企业,锐仕方达致力于通过IT信息技术的不断创新和运用,努力创建业内更加透明和高效的人力资源生态服务机构,助力中国企业拓展全球业务市场,加入全球人才竞争格局之中是锐仕方达不变的初衷。
公司主页