算法研究员

4-7万·15薪

北京海淀区
经验不限
博士
全职
招1人

职位描述

大模型算法自然语言处理LLM人工智能

【岗位职责】
1. 负责病理大语言模型(LLM)的核心开发工作：负责在通用大语言模型下基于病理学领域知识专用病理大语言模型预训练、指令微调(SFT)及强化学习(RL)等全流程技术落地。参与数据体系构建，包括基于模型特性的语料清洗；深入探索大模型底层技术优化，聚焦模型架构改进、上下文扩展、推理性能提升等方向，解决实际业务中的技术瓶颈。
2. 病理报告自动化生成引擎：研发基于现有病理图像诊断系统病理报告自动生成引擎，实现专业术语标准化润色及语句重构功能，显著提升病理报告撰写的规范性与效率。实现跨病例知识联想功能，基于病理学知识图谱实现疑难病例的辅助推理与鉴别诊断建议功能。
3. 场景化应用落地与学术创新：配合业务需求，将病理大语言模型集成至产品或服务中，提供技术支持并持续选代模型效果；撰写高质量技术论文与专利，推动团队在计算病理学领域的学术领先地位。
【岗位要求】
基本条件
1.计算机科学、人工智能、数学或相关专业博士学历（特别优秀的硕士可破格考虑）。
2.具备强逻辑思维与问题拆解能力，能独立完成技术调研与实验设计。
3. 练掌握PyTorch框架，熟悉主流大语言模型架构及训练方法。
4.熟悉大语言模型开发流程，包括数据清洗、分布式训练、效果评估等。3年以上NLP工作经验。
5.至少1年大模型（LLM）实战经验；有病理AI项目经验者优先。
核心技术能力
1.大模型技术栈：深入理解Transformer、MoE架构，熟练掌握Pretraining、SFT、RLHF、DPO等关键技术。具备优秀的逻辑思维与技术攻关能力，能独立设计实验、分析结果并推动技术迭代。能与病理科医生、产品经理及工程团队高效协作，准确转化临床需求为技术方案。
2.分布式训练：熟悉DeepSpeed、FSDP等大规模分布式训练框架，有千亿参数模型训练或微调经验者优先。3.论文成果，在Nature Communications、 Modern Pathology或Nature Medicine/Lancet Digital Health等顶刊顶会发表过相关论文者优先。
4.开源贡献：有Hugging Face、GitHub开源项目贡献经验，或参与过LLaMA、Qwen、DeepSeek等开源模型生态建设者优先。