该职位已失效,看看其他机会吧

AI框架优化工程师(A11025)

3-4万·16薪
  • 北京东城区
  • 5-10年
  • 硕士
  • 全职
  • 招1人

职位描述

通信算法PyTorchPythonC语言电子/半导体/集成电路
职位描述:
1.研发分布式训练加速方案,优化并行策略方案例如:DP/TP/PP/MP/CP,提升千亿参数模型训练吞吐量;
2.设计混合精度训练与显存优化方案,开发自适应梯度压缩、通信优化模块,实现单卡训练模型规模提升和降低分布式训练通信开销;
3.开发量化压缩工具链(支持GPTQ/AWQ等算法),实现模型8/4-bit无损量化部署;
4.设计多GPU推理调度策略,优化显存碎片管理与计算资源利用率;
5.跟进vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架构/稀疏化训练等新型范式,将最新学术成果快速落地到工程实践。
职位要求:
1.计算机相关专业硕士及以上学历,3+年LLM系统优化经验;
2.精通PyTorch/TensorFlow框架底层机制,具备CUDA/C++内核开发能力;
3.掌握Megatron-LM/DeepSpeed/HuggingFace生态核心原理;
4.有千亿参数模型训练优化或百万QPS推理服务落地经验者优先;
5.熟悉NVIDIA GPU架构与性能分析工具;
6.熟悉大模型推理服务架构设计与微服务化部署。
查看全部

工作地点

东城区北京城建智控科技股份有限公司琉璃井路2号院4号楼

职位发布者

牛女士/HRBP

立即沟通
公司Logo北京城建智控科技股份有限公司
北京城建智控科技股份有限公司(以下简称“城建智控”或“公司”)成立于2014年10月,是北京城建集团科技服务板块的重要组成部分。公司致力于成为国内领先的“数字城市”综合解决方案服务商,重点服务国家“数字经济”战略,打造集“设计、研发、制造、集成、运维”为一体的数字技术一站式服务体系。公司深耕数字交通领域,以“云计算、大数据、物联网、人工智能”等新兴技术为核心,打造“产品+服务”的交通数字化转型体系,推动了中国城市轨道交通行业的数字化转型升级。公司市场范围已覆盖国内28个省/自治区/直辖市,100个总包业主,60个城市,并为多个海外客户提供技术及产品输出服务。截至目前,公司已成为国家高新技术企业、国务院“科改示范企业”、国家级专精特新“小巨人”、北京市“隐形冠军”企业、北京市市级企业技术中心。作为轨道交通行业第一家拥有设计背景的智慧城轨综合解决方案提供商、中国第一家专注轨道交通云平台业务的国有控股公司,公司以设计引领和科技创新为双轮驱动,创新产品研发,实现高质量发展,力争“十四五”末,成为北京城建集团旗下第一家提供科技创新产品及服务的上市公司。
公司主页