更新于 今天

资深优化专家(天津)(J13633)

3-6万
  • 天津西青区
  • 3-5年
  • 博士
  • 全职
  • 招1人

职位描述

工作职责
1、负责大语言模型线上推理框架的性能优化,解决高并发、低延迟、高可靠性等核心问题,提升服务吞吐量与稳定性;
2、优化多卡(如NVIDIAGPU集群)资源调度与通信效率,支持千卡级训练/推理场景;
3、深度适配NVIDIAGPU硬件架构,利用CUDA、cuDNN等工具链进行算子级优化,提升模型计算效率与显存利用率;
4、调研并引入前沿技术(如异构计算、AI编译器优化),推动模型量化、蒸馏等轻量化方案落地
任职资格
1、3年以上工作经验,计算机/电子/数学等相关专业博士及以上学历;
2、编程能力:精通C/C++,熟悉Python,具备扎实的数据结构与算法基础,有实际性能调优者优先
3、GPU与CUDA:熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显有管理、多流并发等技术,有实际性能调优经验;
4、框架与工具:熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架;
5、工程经验:有分布式系统开发经验,熟悉MPI、NCCL等通信库,或参与过大模型训练/推理项目者优先
加分项
1、熟悉硬件加速技术(如FP16/BF16混合精度、GPU Direct RDMA);
2、有大规模推荐系统、NLP模型优化经验,或开源社区贡献经历;
3、具备跨团队协作能力,能与算法、业务团队紧密配合推动技术落地

工作地点

西青区天津市中科曙光

认证资质

营业执照信息

职位发布者

梁慧敏/HRBP

刚刚活跃
立即沟通
公司Logo曙光信息产业(北京)有限公司
曙光信息产业股份有限公司(以下简称“中科曙光”)作为我国核心信息基础设施领军企业,为中国及全球用户提供创新、高效、可靠的IT产品、解决方案及服务。公司于2014年在上海证券交易所上市(股票代码:603019)。经历20余年发展,中科曙光在高端计算、存储、安全、数据中心等领域拥有深厚的技术积淀和领先的市场份额,并充分发挥高端计算优势,布局智能计算、云计算、大数据等领域的技术研发,打造计算产业生态,为科研探索创新、行业信息化建设、产业转型升级、数字经济发展提供了坚实可信的支撑。中科曙光在全国各省、自治区和直辖市均设立了分支机构,拥有国际领先的3大智能制造生产基地、5大研发中心,在全国50多个城市部署了城市云计算中心。作为以技术创新为基因的科技企业,中科曙光未来将持续专注于核心技术研发,并与用户、合作伙伴携手共建应用生态、推动产业进步,以科技创新助力“数字中国”建设,驱动经济高质量发展。公司网址:www.sugon.com
公司主页