· 负责医疗垂直领域大模型以及通用大模型(重点关注如 DeepSeek-R1 等优秀模型)的训练、微调与迭代,持续提升模型在医学专业知识上的准确性与逻辑推理能力。
· 结合海量健康数据(包括智能硬件、居家健康基站等多元数据源),开发并优化智能问诊、病历解析、个性化健康方案生成等核心算法模块。
· 搭建并优化基于医学文献、诊疗指南的 RAG(检索增强生成)系统,解决大模型在医疗场景下的“幻觉”问题,确保输出的安全与合规。
· 优化模型推理速度与资源消耗,探索 Context Caching(上下文缓存)等加速方案,确保高并发医疗咨询服务下的系统稳定性。
与 UI 交互设计、前端应用(Flutter/Vue)、以及生物技术研发团队紧密合作,推动算法模型在智能终端和健康联盟链生态中的高效落地。
岗位要求:
· 计算机科学、人工智能、生物医学工程、医学信息学等相关专业本科及以上学历。
· 扎实的 Python 编程功底;熟练掌握 PyTorch 深度学习框架,熟悉 Linux 开发环境。
· 了解深度学习的相关原理以及算法,深入理解反向传播、梯度优化以及正则化机制,熟练运用各类损失函数(如 Focal Loss)进行模型调优。
· 深入理解 Transformer 架构,熟悉主流开源大模型(如 DeepSeek, LLaMA, Qwen 等)的底层原理与应用。
· 全链路训练实战: 具备大模型预训练(Pre-training)、指令微调(SFT)、强化学习对齐(RLHF/DPO)的完整实战经验。熟练使用 LLaMA-Factory 等高效训练框架,精通 LoRA 等参数高效微调(PEFT)技术。
· 对技术充满热情,能够快速跟进并复现 LLM 和医疗 AI 领域的最新顶会论文与开源成果。
· 具备极强的逻辑分析能力和跨学科思维;面对极具挑战的医疗科技问题,有强大的自驱力和解决未知问题的能力。