更新于 4月2日

大模型算法工程师

3-6万

北京海淀区
1-3年
硕士
全职
招1人

深度学习多模态算法大模型算法人工智能

一、核心岗位职责
本岗位聚焦于大语言模型、多模态大模型的全流程算法研发与工程化落地，负责从模型架构优化、训练调优到业务场景适配、性能迭代的全链路工作，推动大模型技术在实际业务场景中稳定落地并实现价值最大化，同时跟进行业前沿技术，搭建团队核心算法能力体系，具体职责如下：
1. 大模型算法研发与架构优化
- 负责大语言模型、多模态大模型的核心算法研发，包括预训练模型架构设计、微调算法优化、Prompt工程迭代、检索增强生成（RAG）、模型量化与蒸馏、对齐算法（RLHF/DPO）等核心技术落地，针对业务痛点优化模型生成效果、推理速度与泛化能力。
- 调研并复现国际前沿大模型技术与论文成果，结合公司业务场景完成技术选型与创新改造，搭建适配业务的大模型技术框架，解决模型训练过程中的梯度消失、过拟合、模态融合失衡等技术难题。
- 参与大模型预训练数据 pipeline 搭建，负责数据清洗、去重、筛选、标注策略制定，优化数据质量与数据集结构，提升预训练与微调阶段的模型收敛效率和输出质量。
2. 模型训练、调优与性能迭代
- 独立完成大模型的预训练、指令微调、对齐训练全流程操作，熟练使用分布式训练框架，优化训练策略与超参数配置，降低训练成本与耗时，提升模型在特定业务场景（如客服问答、内容生成、代码开发、数据分析等）的准确率、流畅度与专业性。
- 搭建模型效果评估体系，制定量化评估指标与人工评测标准，持续跟踪模型线上表现，针对生成内容不合规、逻辑错误、 hallucination（幻觉）等问题，迭代优化算法与训练方案。
- 负责大模型的轻量化优化，包括模型量化（INT4/INT8）、剪枝、知识蒸馏等技术落地，在保证模型效果的前提下，降低模型推理时延与显存占用，适配端侧或高并发线上部署场景。
3. 工程化落地与跨团队协作
- 配合工程团队完成大模型的线上部署、推理服务优化，解决模型部署过程中的兼容性、稳定性、高并发问题，实现模型算法到生产环境的无缝衔接，保障模型服务稳定运行。
- 对接业务部门需求，拆解业务场景中的大模型应用方案，输出算法设计文档与技术方案，独立完成场景化模型定制与功能开发，推动大模型在核心业务线的落地应用与效果迭代。
- 整理技术沉淀与经验总结，输出团队内部技术文档、算法手册，参与团队技术分享与人才培养，协助搭建大模型算法研发团队的技术能力体系。
4. 技术调研与前沿跟进
持续跟踪国内外大模型领域顶尖论文、开源项目与技术趋势，重点关注多模态融合、长文本理解、模型安全、高效训练等方向，定期输出技术调研分析报告，为团队技术规划与产品迭代提供核心参考。
二、任职需求
（一）基础硬性要求
- 学历背景：计算机、人工智能、软件工程、数学、统计学等相关专业，硕士及以上学历优先，具备自然语言处理、机器学习、深度学习相关研究或工作经历。
- 工作经验：2年及以上大模型算法研发相关工作经验，有完整的大模型预训练、微调、落地项目经验者优先；优秀应届博士或硕士研究生，若有顶会论文（ACL/NeurIPS/ICML/EMNLP等）或知名开源大模型贡献经历，可放宽工作经验要求。
- 理论基础：扎实掌握深度学习、机器学习核心理论，精通自然语言处理（NLP）基础算法，深入理解Transformer架构、大模型预训练与微调机制、注意力机制、优化器原理等核心知识。
（二）核心技能要求
- 编程与框架：熟练掌握Python编程语言，精通至少一种深度学习框架（PyTorch优先，TensorFlow次之），熟练使用Hugging Face Transformers、Datasets、Accelerate等大模型开源工具库，熟悉DeepSpeed、Megatron-LM等分布式训练框架。
- 大模型实操能力：具备独立完成大模型指令微调、RLHF/DPO对齐、RAG系统搭建、模型量化蒸馏的实操经验，熟悉主流开源大模型（Llama、Qwen、GLM、Baichuan等）的架构与使用方法，能快速基于开源模型做二次开发与定制优化。
- 工程与部署能力：熟悉Linux开发环境，掌握Git、Docker等工具，了解模型推理服务部署流程（如FastAPI、TorchServe），具备基础的CUDA编程能力，能优化模型推理性能。
- 数据与评估能力：熟悉大模型数据处理流程，掌握数据清洗、筛选、构建技巧，能独立搭建模型效果评估体系，熟练使用各类NLP模型评估指标（Perplexity、BLEU、ROUGE、F1值等），具备问题排查与效果优化能力。
（三）软实力与加分项
- 具备强烈的技术钻研精神，逻辑思维严谨，具备较强的问题拆解能力与独立解决复杂技术难题的能力，做事细心负责，具备良好的团队协作意识与沟通能力。
- 加分项1：有顶会AI论文发表经历，或参与过知名开源大模型项目贡献；
- 加分项2：具备多模态大模型（文生图、图文跨模态理解）研发或落地经验；
- 加分项3：熟悉大模型安全合规技术，具备模型幻觉优化、内容安全管控相关经验；
- 加分项4：有ToB端大模型应用、行业大模型（金融、教育、医疗、客服等）定制落地经验；
- 加分项5：具备代码大模型、长文本大模型研发经验，熟悉大规模分布式训练集群使用。

海淀区北京友谊宾馆

公司介绍

智联猎头作为智联招聘旗下品牌，以满足企业中高端岗位的人才招聘需求为出发点，整合全球优质资源，覆盖数字经济、新一代信息技术、人工智能、金融、电子信息、装备制造、生物医药与健康、房地产/建筑等数十个行业，拥有规模庞大、覆盖面广的交付团队，致力于向企业输出专业化的招聘解决方案。智联猎头目前拥有卓聘平台服务、招聘流程外包服务、高端人才猎寻服务三大类核心服务，具备高度定制化能力，能够为不同发展阶段的企业提供一站式招聘解决方案，同时为企业转型升级提供保障，全面增强企业核心竞争力！智联猎头利用自身独特的资源优势、成熟的服务模式，以及多层次的产品，致力于打造高效、专业的一站式人才服务模式，让招聘更加美好！

查看全部信息

北京北大方正电子有限公司

3-5年硕士自然语言处理 Python 人工智能计算机软件云计算/大数据

中核战略规划研究总院有限公司

3-5年硕士大模型算法深度学习人工智能云计算/大数据计算机软件

5-10年本科算法开发容器化铁路行业

3-5年本科人工智能

3-5年本科 Python