更新于 9月20日

模型训练专家

5-9万·14薪
  • 北京海淀区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

深度学习预训练工程化落地人工智能
一、岗位需求:
1、能独立闭环专项算法研发的实战专家,强调工程化能力(代码/实验/部署全流程经验);
2、负责大语言模型关键技术攻关。
二、能力画像/专业要求:
1、深度参与过千亿/百亿参数级大模型全生命周期开发(数据-训练-微调-部署),具有一线实操经验;
2、熟悉预训练中的关键技术陷阱(如梯度爆炸、显存溢出、过拟合),掌握预训练调参黄金法则,掌握分布式训练优化策略(如ZeRO、Offload、PP, TP, SP)、掌握训练加速方案(混合精度/梯度累积);
3、熟悉分布式训练框架deepspeed, megatron和底层相关实现;
4、精通RLHF、长文本处理(如YaRN)、推理优化(Speculative Decoding)、P-D detach、数据增强策略(合成数据生成、对抗样本注入);精通模型架构改进(如MoE设计、FlashAttention优化)。

工作地点

北京海淀区博思软件

职位发布者

肖丽仙/人事经理

刚刚活跃
立即沟通
公司Logo厦门贤士达信息咨询有限公司
厦门贤士达是国内为数不多专注做IT、通信、电子制造业的专业人力资源服务公司。公司拥有众多训练有素的全职顾问,强大的服务支持与专业能力遍及中国最主要商业城市。以具有专业禀赋的灵活性和高效率,为客户提供招聘解决方案。贤士达核心客户群,主要集中在已进入中国市场的跨国公司、知名的中国大企业、成长中的民营企业。尤其擅长为企业推荐关键技术职位和中、高层管理人才,为IT公司引入批量的工程师和中高端的技术管理人才,协助其迅速搭建研发分部。贤士达已经为国内外成功推荐200多名IT人才,其中知名公司包含:华为、星网锐捷、锐捷网络、联迪商用、爱立信、豪氏威马、瑞声达、亿联等知名公司。我们致力于:“帮企业提升发展动力,助个人成就理想生涯!”服务范围IT服务外包高级人才寻访RPO
公司主页