岗位职责:
1、负责医疗场景下音频相关算法的设计、开发与优化,包括但不限于:问诊语音识别、音频信号分析、医患对话语音转文字(ASR)及语义提取;
2、研究音频降噪、特征提取、情感分析等技术,解决医疗环境中复杂音频(如背景噪音、方言口音)的识别准确率问题;
3、搭建音频数据处理 pipeline,实现音频数据的标注、清洗、增强,支撑算法模型训练与迭代;
4、与产品、医学团队协作,将音频算法落地到辅助诊断系统、远程问诊平台等产品,满足临床实际需求;
5、跟踪音频领域前沿技术(如大模型语音交互、多模态音频分析),并探索在医疗场景的应用落地。
任职要求:
1、硕士及以上学历,计算机科学、电子工程、信号处理、人工智能等相关专业,3 年以上音频算法开发经验;
2、精通音频信号处理基础理论,熟练掌握 ASR、音频特征提取(MFCC、梅尔频谱等)、语音情感分析等核心算法;
3、熟练使用 Python/C++,熟悉 TensorFlow/PyTorch 等深度学习框架,有音频相关模型(如 Wav2Vec2、Whisper)训练与优化经验;
4、有医疗 / 健康领域音频项目经验(如医疗语音助手、临床音频分析)者优先,了解中医基础理论者加分;
5、具备良好的问题解决能力、跨团队沟通能力,能独立负责算法从设计到落地的全流程。