职位描述
深度学习多模态算法大模型算法人工智能
一、核心岗位职责
本岗位聚焦于大语言模型、多模态大模型的全流程算法研发与工程化落地,负责从模型架构优化、训练调优到业务场景适配、性能迭代的全链路工作,推动大模型技术在实际业务场景中稳定落地并实现价值最大化,同时跟进行业前沿技术,搭建团队核心算法能力体系,具体职责如下:
1. 大模型算法研发与架构优化
- 负责大语言模型、多模态大模型的核心算法研发,包括预训练模型架构设计、微调算法优化、Prompt工程迭代、检索增强生成(RAG)、模型量化与蒸馏、对齐算法(RLHF/DPO)等核心技术落地,针对业务痛点优化模型生成效果、推理速度与泛化能力。
- 调研并复现国际前沿大模型技术与论文成果,结合公司业务场景完成技术选型与创新改造,搭建适配业务的大模型技术框架,解决模型训练过程中的梯度消失、过拟合、模态融合失衡等技术难题。
- 参与大模型预训练数据 pipeline 搭建,负责数据清洗、去重、筛选、标注策略制定,优化数据质量与数据集结构,提升预训练与微调阶段的模型收敛效率和输出质量。
2. 模型训练、调优与性能迭代
- 独立完成大模型的预训练、指令微调、对齐训练全流程操作,熟练使用分布式训练框架,优化训练策略与超参数配置,降低训练成本与耗时,提升模型在特定业务场景(如客服问答、内容生成、代码开发、数据分析等)的准确率、流畅度与专业性。
- 搭建模型效果评估体系,制定量化评估指标与人工评测标准,持续跟踪模型线上表现,针对生成内容不合规、逻辑错误、 hallucination(幻觉)等问题,迭代优化算法与训练方案。
- 负责大模型的轻量化优化,包括模型量化(INT4/INT8)、剪枝、知识蒸馏等技术落地,在保证模型效果的前提下,降低模型推理时延与显存占用,适配端侧或高并发线上部署场景。
3. 工程化落地与跨团队协作
- 配合工程团队完成大模型的线上部署、推理服务优化,解决模型部署过程中的兼容性、稳定性、高并发问题,实现模型算法到生产环境的无缝衔接,保障模型服务稳定运行。
- 对接业务部门需求,拆解业务场景中的大模型应用方案,输出算法设计文档与技术方案,独立完成场景化模型定制与功能开发,推动大模型在核心业务线的落地应用与效果迭代。
- 整理技术沉淀与经验总结,输出团队内部技术文档、算法手册,参与团队技术分享与人才培养,协助搭建大模型算法研发团队的技术能力体系。
4. 技术调研与前沿跟进
持续跟踪国内外大模型领域顶尖论文、开源项目与技术趋势,重点关注多模态融合、长文本理解、模型安全、高效训练等方向,定期输出技术调研分析报告,为团队技术规划与产品迭代提供核心参考。
二、任职需求
(一)基础硬性要求
- 学历背景:计算机、人工智能、软件工程、数学、统计学等相关专业,硕士及以上学历优先,具备自然语言处理、机器学习、深度学习相关研究或工作经历。
- 工作经验:2年及以上大模型算法研发相关工作经验,有完整的大模型预训练、微调、落地项目经验者优先;优秀应届博士或硕士研究生,若有顶会论文(ACL/NeurIPS/ICML/EMNLP等)或知名开源大模型贡献经历,可放宽工作经验要求。
- 理论基础:扎实掌握深度学习、机器学习核心理论,精通自然语言处理(NLP)基础算法,深入理解Transformer架构、大模型预训练与微调机制、注意力机制、优化器原理等核心知识。
(二)核心技能要求
- 编程与框架:熟练掌握Python编程语言,精通至少一种深度学习框架(PyTorch优先,TensorFlow次之),熟练使用Hugging Face Transformers、Datasets、Accelerate等大模型开源工具库,熟悉DeepSpeed、Megatron-LM等分布式训练框架。
- 大模型实操能力:具备独立完成大模型指令微调、RLHF/DPO对齐、RAG系统搭建、模型量化蒸馏的实操经验,熟悉主流开源大模型(Llama、Qwen、GLM、Baichuan等)的架构与使用方法,能快速基于开源模型做二次开发与定制优化。
- 工程与部署能力:熟悉Linux开发环境,掌握Git、Docker等工具,了解模型推理服务部署流程(如FastAPI、TorchServe),具备基础的CUDA编程能力,能优化模型推理性能。
- 数据与评估能力:熟悉大模型数据处理流程,掌握数据清洗、筛选、构建技巧,能独立搭建模型效果评估体系,熟练使用各类NLP模型评估指标(Perplexity、BLEU、ROUGE、F1值等),具备问题排查与效果优化能力。
(三)软实力与加分项
- 具备强烈的技术钻研精神,逻辑思维严谨,具备较强的问题拆解能力与独立解决复杂技术难题的能力,做事细心负责,具备良好的团队协作意识与沟通能力。
- 加分项1:有顶会AI论文发表经历,或参与过知名开源大模型项目贡献;
- 加分项2:具备多模态大模型(文生图、图文跨模态理解)研发或落地经验;
- 加分项3:熟悉大模型安全合规技术,具备模型幻觉优化、内容安全管控相关经验;
- 加分项4:有ToB端大模型应用、行业大模型(金融、教育、医疗、客服等)定制落地经验;
- 加分项5:具备代码大模型、长文本大模型研发经验,熟悉大规模分布式训练集群使用。
本岗位聚焦于大语言模型、多模态大模型的全流程算法研发与工程化落地,负责从模型架构优化、训练调优到业务场景适配、性能迭代的全链路工作,推动大模型技术在实际业务场景中稳定落地并实现价值最大化,同时跟进行业前沿技术,搭建团队核心算法能力体系,具体职责如下:
1. 大模型算法研发与架构优化
- 负责大语言模型、多模态大模型的核心算法研发,包括预训练模型架构设计、微调算法优化、Prompt工程迭代、检索增强生成(RAG)、模型量化与蒸馏、对齐算法(RLHF/DPO)等核心技术落地,针对业务痛点优化模型生成效果、推理速度与泛化能力。
- 调研并复现国际前沿大模型技术与论文成果,结合公司业务场景完成技术选型与创新改造,搭建适配业务的大模型技术框架,解决模型训练过程中的梯度消失、过拟合、模态融合失衡等技术难题。
- 参与大模型预训练数据 pipeline 搭建,负责数据清洗、去重、筛选、标注策略制定,优化数据质量与数据集结构,提升预训练与微调阶段的模型收敛效率和输出质量。
2. 模型训练、调优与性能迭代
- 独立完成大模型的预训练、指令微调、对齐训练全流程操作,熟练使用分布式训练框架,优化训练策略与超参数配置,降低训练成本与耗时,提升模型在特定业务场景(如客服问答、内容生成、代码开发、数据分析等)的准确率、流畅度与专业性。
- 搭建模型效果评估体系,制定量化评估指标与人工评测标准,持续跟踪模型线上表现,针对生成内容不合规、逻辑错误、 hallucination(幻觉)等问题,迭代优化算法与训练方案。
- 负责大模型的轻量化优化,包括模型量化(INT4/INT8)、剪枝、知识蒸馏等技术落地,在保证模型效果的前提下,降低模型推理时延与显存占用,适配端侧或高并发线上部署场景。
3. 工程化落地与跨团队协作
- 配合工程团队完成大模型的线上部署、推理服务优化,解决模型部署过程中的兼容性、稳定性、高并发问题,实现模型算法到生产环境的无缝衔接,保障模型服务稳定运行。
- 对接业务部门需求,拆解业务场景中的大模型应用方案,输出算法设计文档与技术方案,独立完成场景化模型定制与功能开发,推动大模型在核心业务线的落地应用与效果迭代。
- 整理技术沉淀与经验总结,输出团队内部技术文档、算法手册,参与团队技术分享与人才培养,协助搭建大模型算法研发团队的技术能力体系。
4. 技术调研与前沿跟进
持续跟踪国内外大模型领域顶尖论文、开源项目与技术趋势,重点关注多模态融合、长文本理解、模型安全、高效训练等方向,定期输出技术调研分析报告,为团队技术规划与产品迭代提供核心参考。
二、任职需求
(一)基础硬性要求
- 学历背景:计算机、人工智能、软件工程、数学、统计学等相关专业,硕士及以上学历优先,具备自然语言处理、机器学习、深度学习相关研究或工作经历。
- 工作经验:2年及以上大模型算法研发相关工作经验,有完整的大模型预训练、微调、落地项目经验者优先;优秀应届博士或硕士研究生,若有顶会论文(ACL/NeurIPS/ICML/EMNLP等)或知名开源大模型贡献经历,可放宽工作经验要求。
- 理论基础:扎实掌握深度学习、机器学习核心理论,精通自然语言处理(NLP)基础算法,深入理解Transformer架构、大模型预训练与微调机制、注意力机制、优化器原理等核心知识。
(二)核心技能要求
- 编程与框架:熟练掌握Python编程语言,精通至少一种深度学习框架(PyTorch优先,TensorFlow次之),熟练使用Hugging Face Transformers、Datasets、Accelerate等大模型开源工具库,熟悉DeepSpeed、Megatron-LM等分布式训练框架。
- 大模型实操能力:具备独立完成大模型指令微调、RLHF/DPO对齐、RAG系统搭建、模型量化蒸馏的实操经验,熟悉主流开源大模型(Llama、Qwen、GLM、Baichuan等)的架构与使用方法,能快速基于开源模型做二次开发与定制优化。
- 工程与部署能力:熟悉Linux开发环境,掌握Git、Docker等工具,了解模型推理服务部署流程(如FastAPI、TorchServe),具备基础的CUDA编程能力,能优化模型推理性能。
- 数据与评估能力:熟悉大模型数据处理流程,掌握数据清洗、筛选、构建技巧,能独立搭建模型效果评估体系,熟练使用各类NLP模型评估指标(Perplexity、BLEU、ROUGE、F1值等),具备问题排查与效果优化能力。
(三)软实力与加分项
- 具备强烈的技术钻研精神,逻辑思维严谨,具备较强的问题拆解能力与独立解决复杂技术难题的能力,做事细心负责,具备良好的团队协作意识与沟通能力。
- 加分项1:有顶会AI论文发表经历,或参与过知名开源大模型项目贡献;
- 加分项2:具备多模态大模型(文生图、图文跨模态理解)研发或落地经验;
- 加分项3:熟悉大模型安全合规技术,具备模型幻觉优化、内容安全管控相关经验;
- 加分项4:有ToB端大模型应用、行业大模型(金融、教育、医疗、客服等)定制落地经验;
- 加分项5:具备代码大模型、长文本大模型研发经验,熟悉大规模分布式训练集群使用。
工作地点
海淀区北京友谊宾馆

公司信息
公司介绍
智联猎头作为智联招聘旗下品牌,以满足企业中高端岗位的人才招聘需求为出发点,整合全球优质资源,覆盖数字经济、新一代信息技术、人工智能、金融、电子信息、装备制造、生物医药与健康、房地产/建筑等数十个行业,拥有规模庞大、覆盖面广的交付团队,致力于向企业输出专业化的招聘解决方案。智联猎头目前拥有卓聘平台服务、招聘流程外包服务、高端人才猎寻服务三大类核心服务,具备高度定制化能力,能够为不同发展阶段的企业提供一站式招聘解决方案,同时为企业转型升级提供保障,全面增强企业核心竞争力!智联猎头利用自身独特的资源优势、成熟的服务模式,以及多层次的产品,致力于打造高效、专业的一站式人才服务模式,让招聘更加美好!

更新于 4月2日


