更新于 4月23日

大模型推理引擎研发工程师

面议
  • 北京海淀区
  • 3-5年
  • 本科
  • 全职
  • 招5人

职位描述

大模型算法
岗位职责:
1. 参与分离式架构推理引擎的研发工作,包括方案设计、编码、测试方案设计与执行、性能画像等;
2. 追踪前沿技术,并进行落地探索,包括但不限于友商方案比对、开源方案调研、阅读论文、性能数据分析等;
3. 进行显存相关的优化工作,比如KVCache压缩、卸载等。
任职要求:
1. 本科及以上学历,3年及以上工作经验,计算机科学、人工智能、大数据等相关专业优先;
2. 具有人工智能、深度学习算法建模开发、模型训练推理经验优先录取;
3. 熟悉并行策略、通信优化、KVCache、任意一种加速器并能够进行性能Profiling、算子优化、算子融合等优先;
4. 熟悉开源推理引擎,比如vLLM、SGLang、TensorRT-LLM等、模型量化压缩技术优先;
5. 学习新知识能力强,独立发现解决问题能力强,具备较强的工程能力且有实际工程项目经验。

工作地点

北京海淀区硅谷亮城3A

职位发布者

刘女士/HR

当前在线
立即沟通
公司Logo联通数字科技有限公司
联通数字科技有限公司是中国联通的全资子公司,在原联通系统集成有限公司、联通云数据有限公司、联通大数据有限公司、联通物联网有限责任公司、联通智安全科技有限公司基础上组建而成,是中国联通建设“数字信息基础设施运营服务国家队,网络强国数字中国智慧社会建设主力军,数字创新融合排头兵”的核心成员和坚实力量。联通数科聚焦集团公司“大联接,大计算,大数据,大应用,大安全”五大主责主业,以做可信赖的政企客户数字化转型服务商为企业宗旨。下设六大事业部,一个创新研究院,三大研发中心,作为出资主体共计持股34家全资、控股和参股公司。
公司主页