更新于 3月19日

高级AI Infra工程师

4-6万·14薪
  • 济南历下区
  • 3-5年
  • 硕士
  • 全职
  • 招2人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 团队执行强
  • 人际关系好
  • 氛围活跃
  • 交通便利
  • 实力大公司
  • 五险一金

职位描述

深度学习多模态算法DEEPSPEEDMEGATRON人工智能
岗位职责:
1、负责Al Infra领域核心技术攻坚,设计语言/视觉/多模态大模型训练及推理的技术架构和实现方案,更高效的实现模型训练和推理;
2、结合异构硬件(如CPU/GPU/NPU)的特性,通过算子优化、异步并发、I/O优化等方式减少计算耗时,优化计算效率;
3、根据AI模型的发展趋势(如长序列、稀疏等),提前规划和研发分布式计算新技术和异构计算新硬件,完成高性能计算框架的设计、研发和优化。
任职要求:
1、硕士及以上学历,计算机、通信或数学等相关专业;
2、熟悉常用AI框架,精通Deepspeed、Megatron等主流训练加速框架技术细节,掌握通过算力、网络、存储的优化来提升训练推理效率的技术方法;
3、熟练使用Scala/C++/Go等编程语言进行过大型分布式软件开发,熟悉高性能网络、高性能存储技术;
5、具备各层次的软件优化的经验,包括但不限于如软件业务优化、算法策略优化、高并发和分布式优化、各类型I0优化、存储优化、缓存优化、CPU/GPU的指令集优化等;
4、熟悉GPU硬件架构,精通CUDA、CUDNN、NCCL等,在深度学习计算框架等领域有丰富优化经验者优先;
6、具备卓越的战略思维与执行能力,有较强的组织领导、沟通和协调能力;

工作地点

济南历下区浪潮科技园

职位发布者

潘女士/HR

立即沟通
公司Logo浪潮集团公司标签
浪潮集团是中国领先的云计算、大数据服务商,拥有三家上市公司。主要业务涉及计算装备、软件、云计算服务、新一代通信、大数据及若干应用场景。作为中国最早的IT品牌之一,浪潮致力于成为世界一流的新一代信息技术龙头企业经济社会数字化转型的优秀服务商,新型基础设施建设的骨干企业。
公司主页