职位描述
- 负责大语言模型(LLM)、多模态大模型(文本/图像/语音)的全链路研发,涵盖预训练(Pre-training)、指令微调(SFT)、偏好对齐(RLHF/DPO/GRPO)等核心环节,持续优化模型性能、精度与推理效率,突破复杂场景下的逻辑推理与指令遵循天花板。
- 深入钻研大模型底层原理,探索Transformer、MoE等主流架构的优化方案,研发知识蒸馏、量化压缩、稀疏化等关键技术,在保证模型效果的前提下,有效降低训练与部署成本,适配云边端协同部署需求。
- 跟踪国内外大模型领域前沿技术(如Agent智能体、RAG检索增强、工具调用、多Agent协作等),结合行业垂类场景开展技术预研与创新,推动实验室技术转化为可落地的产品能力,打造“技术-业务”闭环。
- 负责大模型训练数据的策略设计,包括高质量数据挖掘、清洗、标注及合成数据(Synthetic Data)构建,搭建数据飞轮体系,实现“模型训练-业务反馈-数据迭代”的持续优化。
(二)模型工程化落地
- 负责大模型的工程化实现与部署,搭建高效、可扩展的模型训练与推理流水线,优化部署性能(延迟、吞吐量),解决生产环境中模型运行的稳定性、可靠性及成本控制问题,适配大规模商业化应用场景。
- 参与大模型相关工具链、研发平台的搭建与优化,包括数据处理、模型监控、自动化评测(含LLM-as-judge)、效果评估体系的构建,提升团队研发效率与模型可维护性。
- 结合具体业务需求,设计大模型应用解决方案(如智能对话、内容生成、智能决策、垂类行业适配等),深入业务场景拆解需求,推动模型在金融、教育、办公等领域落地见效,实现业务价值提升。
- 负责模型上线后的效果迭代与问题排查,建立监控、告警、兜底与人工接管机制,防范模型“幻觉”等常见问题,保障线上服务质量。
(三)技术协作与创新
- 与数据工程师、产品经理、前端开发、业务专家等跨职能团队紧密协作,明确技术需求与验收标准,输出可落地的技术方案,推动项目高效推进。
- 参与技术难题攻关,解决大模型训练、调优、部署过程中的核心技术瓶颈,形成可复用的技术方案与经验沉淀,助力团队技术能力提升。
- 参与技术分享与学术交流,跟踪领域顶会(NeurIPS、ICML、ACL等)最新研究成果,复现前沿技术并落地应用,探索大模型技术在更多领域的创新场景。
三、任职要求
(一)学历与专业
- 本科及以上学历,计算机科学、人工智能、数学、统计学、自动化等相关专业;硕士及以上学历优先,博士学历可放宽工作经验要求(高级岗位、顶尖人才计划优先),双985/双一流院校背景加分。
- 具备扎实的数学基础,深入理解线性代数、概率统计、优化理论等核心知识,掌握机器学习、深度学习基本原理与经典算法,具备Data-centric AI意识。
(二)技术能力
- 精通Python编程,熟练使用PyTorch、TensorFlow、JAX等至少一种深度学习框架,熟悉Hugging Face Transformers、Megatron、DeepSpeed、FSDP等大模型相关工具与库,能独立完成模型搭建与调优。
- 具备大模型相关研发经验,熟悉大模型预训练、微调、对齐的核心流程与技术细节,有完整大模型项目(预训练/微调/落地)研发经验者优先;初级岗位可接受相关实习经验,有垂类大模型(如教育、金融)研发经验者加分。
- 了解大模型工程化相关技术,包括分布式训练、模型量化、推理优化(如vllm)、容器化部署(Docker/K8s)等,有相关实践经验者优先;熟悉Hadoop、MaxCompute等大规模数据处理工具者加分。
- 熟悉NLP、多模态技术(如ASR、TTS、图像生成)者优先,深入掌握Agent、RAG、Prompt Engineering、LangChain等技术并具备落地经验者加分,了解向量数据库(Chroma、Milvus)使用方法者优先。
- 具备良好的算法设计与分析能力,能够独立解决复杂技术问题,有较强的代码编写与调试能力,熟悉Git版本控制工具,具备良好的代码规范。
(三)经验要求
- 初级工程师:1-3年AI算法相关经验,有大模型相关项目参与经验,熟悉大模型基础调优技术,具备良好的学习能力与执行力,能快速跟进前沿技术。
- 中级工程师:3-5年AI算法研发经验,主导过至少1个大模型相关项目(预训练/微调/落地),具备独立负责技术方案设计与实施的能力,深入理解大模型底层原理与优化方法,能解决项目中的核心技术难题。
- 高级工程师:5年以上AI算法研发经验,在大模型领域有深厚的技术积累,主导过大型大模型研发或规模化落地项目,能够引领技术方向,解决行业内核心技术难题,有团队管理经验者优先;具备顶会论文或开源项目核心贡献者优先。
(四)软技能
- 具备强烈的学习意愿与创新精神,能够快速跟踪大模型领域前沿技术,主动探索新技术、新方法,具备快速复现论文技术的能力。
- 具备良好的沟通协作能力与团队合作意识,能够清晰表达技术观点,高效推进跨团队项目合作,具备场景共情力,能理解业务痛点并转化为技术需求。
- 具备较强的责任心、抗压能力与问题解决能力,目标导向,能够高效完成项目任务,对技术细节有严格要求,追求“可落地、可复用、可扩展”的技术方案。
- 具备良好的英文阅读能力,能够阅读领域内顶会论文(如NeurIPS、ICML、ACL等),了解行业最新研究进展者优先,具备英文技术文档撰写能力者加分。
四、加分项
- 在NeurIPS、ICML、ACL、CVPR等顶会发表过大模型相关论文,或有Kaggle等算法竞赛获奖经历者。
- 有开源大模型项目(如Qwen、Deepseek、Llama3、Gemma等)贡献经验,或在AIINFRA社区(如PyTorch、VLLM)有核心贡献者优先。
- 具备合成数据构建、多Agent协作系统研发、垂类大模型定制化落地等相关经验者。
- 拥有大厂AI大模型相关岗位工作或实习经验,参与过百万级参数以上大模型研发或规模化落地项目者。
工作地点

公司信息
公司介绍
成都易训企业管理咨询有限公司,成立于2011年,是业内为数不多的技术驱动型专业公司。易训致力于梯队人才开发、工伤预防治理两大业务板块:专注于为企业梯队人才开发,传播最实效的梯队人才建设理念和专业技术;易训是国内首家专注于工伤预防治理的专业服务机构,是全国领先的工伤预防科学管理与宣传提供商,致力于为政府、企事业单位提供工伤预防一体化解决方案,把工伤预防带给每个人、每个家庭、每个组织,让世界更美好;易训的初心:帮助客户持续走向成功的战略伙伴,员工实现梦想的幸福家园,股东创造社会价值的事业平台;易训的愿景:用智慧创造我们的美好未来; 易训的使命:为客户快速发展提供新动能 价值观:阳光规范、诚信正直、勇于担当、团队至上、成就客户。在易训不是谁引导了谁, 谁塑造了谁,而是碰巧遇到了彼此,互相呼唤和温暖,让沉睡的苏醒,让失落的再现,让真实的、本原的、天良的那个自我重新回到了生活的状态,易训文化带给我们的幸福在最深层次上,就是来自于此,来自于自我的失而复得和回家般的归属感,金风玉露一相逢,便胜却人间无数。 易训人的生活充满着这样一些关键词:梦想、自由、奖励、家庭、快乐工作、幸福生活、阳光灿烂、人情还乡、职业尊严、心力劳苦、体育精神、阅读、分享、光辉形象……随时提醒自己,我们要的是一种有意义的生活。任何时候都不要忘记,我们要一起来呼唤和寻找“我们的生活”。

更新于 5月19日





