该职位已失效,看看其他机会吧

大模型推理加速工程师

面议
  • 北京西城区
  • 西便门
  • 5-10年
  • 硕士
  • 全职
  • 招1人

职位描述

大模型
岗位职责:
1、大模型推理开发:围绕公司核心AI产品,如AI+实名认证、AI+深度鉴伪、AI+风险目标审核、AI+视觉文档风控等,负责大模型的服务化工作,包括模型部署、模型服务开发,以维护和更新;
2、训练与推理加速:负责大模型的训练与推理加速工作,利用裁剪、量化、蒸馏等技术,加速及优化模型的推理效率,提升吞吐量,并解决推理性能瓶颈。
任职资格:
1、硕士研究生及以上学历,计算机及相关专业,具备五年以上相关工作经验;
2、编程语言与技能‌:精通C++、Python、Go等编程语言,熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程;
3、深度学习框架:熟悉主流深度学习框架如PyTorch、TensorFlow、PaddlePaddle等‌;
4、大模型加速优化工作经验:具有量化、剪枝、蒸馏等模型推理加速优化的工作经验者优先;掌握AI加速技术如TensorRT、TVM、VLLM等工作经验者优先
5、其他:具备快速学习能力和团队合作精神。
查看全部

工作地点

北京西城区博瑞琪大厦

职位发布者

张亦佳/中移金科

立即沟通
公司Logo中移金科公司标签
Play Video中移动金融科技有限公司(简称中移金科)是中国移动通信集团全资子公司。围绕集团创“世界一流信息服务科技创新公司”新定位,公司以构建中国移动“通信+金融”生态圈为己任,打造以和包为核心,支付、消金、保险、超级SIM、金融大数据、电商六大领域的“1+6+N”的产品体系,做人民群众最值得信赖、满足数字美好生活需求的数智化产品,致力成为具有信息服务特色的金融科技国家队。发展定位金融服务连接者连接CHBN客户与金融机构,聚焦金融服务,高效支撑全网业务发展的需求。支付场景运营者建设运营支付能力聚合平台,拓展CHBN生活场景,运营各类产品服务,推动价值增长。金融科技赋能者聚焦超级SIM数字资产和金融科技大数据,协同全网解决方案、专业服务的供给。
公司主页