更新于 今天

大模型推理性能优化工程师

1-1.4万
  • 西安 长安区
  • 3-5年
  • 本科
  • 全职
  • 招5人

雇员点评标签

  • 同事很nice
  • 工作环境好
  • 免费班车

职位描述

Attention、GEMVCPU
岗位职责:
1.负责大模型推理性能优化,提升模型在CPU/GPU/NPU等平台上的运行效率。
2.针对GEMM、GEMV、Attention等核心算子进行优化与加速。
3.参与推理系统与框架的设计与优化,提升整体吞吐与时延表现。
4.研究并实践先进推理优化技术,如投机采样(Speculative Decoding)、KV Cache/Prompt Cache、低比特量化、异构计算等。
5.持续跟踪大模型推理优化领域的前沿技术,并推动落地。
任职要求:
1.本科及以上学历,计算机相关专业。
2.熟悉计算机体系结构,具备CPU/GPU/NPU上的性能优化实践经验。
3.熟悉至少一门编程语言:C/C++/PYTHON/CUDA/VULKAN/OPENCL。
4.了解主流大模型架构,如LLM、VLM、DiT等,对Transformer结构有基本理解。
5.具备算子或系统性能优化经验,能够定位性能瓶颈并进行优化。
6.具备良好的工程能力和团队协作能力。
加分项:
1.有大模型推理优化实践(如KV Cache、Speculative Decoding、量化等)。
2.在相关领域发表过论文或维护过开源项目。

工作地点

工作地点
西安长安区荣耀科技园1
位置图标
完善简历

公司信息

诚迈科技股份有限公司

已上市 · 1000-9999人 · 通信运营商/电信增值服务、软件/IT服务、产业互联网平台 已审核 已审核

118 个在招职位

公司介绍

诚迈科技(南京)有限公司成立于2006年9月,2017年1月20日公司成功上市,是一家专业从事软件产品设计、代码开发、质量保证及技术支持等全流程服务的软件服务提供商,致力于提供全球化的专业软件研发服务,专注于移动设备及无线互联网行业软件研发及咨询等服务。诚迈科技总部位于中国南京。经过多年的发展,规模已超过5000人,在加拿大、芬兰及日本设立销售体系,在北京、上海、深圳、武汉、广州和西安设有分支机构,业务覆盖全球,在中国(内地及台湾)、北美、欧洲、日本、韩国等地广泛开展业务。诚迈科技作为行业的领军者,在全球范围内为国内外客提供一流的软件研发和测试服务。专业的研发团队凭借多年的项目经验掌握了行业核心技术,可提供Android行业软件解决方案(车载系统、TV、eBook等);移动互联网软件解决方案(浏览器、APP Store、运营商定制等);云终端解决方案及企业应用和云计算解决方案。在嵌入式测试方面,诚迈科技专业的软件测试团队在测试方法、测试策略、测试标准方面有着丰富的经验,精通手机终端设备中的手机操作系统、手机应用软件等测试。目前,诚迈科技已经与世界级的客户建立了长期友好的合作关系,主要客户广泛分布于终端设备制造商、世界级芯片制造商、运营商及软件公司。如果您崇尚奋斗,渴望创新,并希望同公司一起成长,请加入我们的团队,您可以应对不同的挑战,以激发个人潜能。我们将长期提供多方面的发展机会,并对成绩突出的员工给予职位晋升和物质奖励。您还将享受完善的员工福利制度,包括:弹性工作时间,各项激励奖金,养老保险,医疗保险,失业保险,工伤、生育保险,住房公积金,员工俱乐部,各种员工活动,员工心灵关怀和健康关怀计划,特别节日假期,带薪年假,集体户口(如需要)等。处于高速发展和扩张期的诚迈科技诚邀有志之士与公司同仁一起共创一个伟大的软件企业! 如您希望在以下城市工作,可将简历投递如下地址:南京/北京:hr@archermind.com上海:hr_sh@archermind.com深圳:hr_sz@archermind.com武汉:hr_wh@archermind.com

工商信息

企业名称 诚迈科技股份有限公司
企业类型 股份有限公司(上市)
法人代表 王继平
经营状态 存续
成立时间 2006-09-01
注册资本 2.17亿元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

人工智能研发工程师(J12962)

面议 联通数字科技有限公司
本科 5-10年 深度学习 机器学习

初级深度学习算法工程师

5000-10000元 深圳康微视觉技术有限公司
本科 图像算法 机器视觉 Python PyTorch Shell 人工智能 计算机软件

算法工程师

2-3万 北京国科启明教育科技有限公司
本科 3-5年 图像算法 OpenCV PyTorch 人工智能 带薪假期 下午茶 节日福利 生日福利 入职社保 不定期团建活动 定期体检 半年奖 年终奖 大牛带队

AI大模型训练工程师

2-3.5万·16薪 西安简矽技术有限公司
硕士 3-5年 半导体/芯片 人工智能 计算机软件

高级深度学习算法工程师

1-2万 深圳康微视觉技术有限公司
本科 1-3年 PyTorch C++ 机器视觉 图像算法 人工智能 半导体/芯片

AI算法工程师

1.5-2.5万·14薪 浙江宇视科技有限公司
硕士 1-3年 深度学习算法 视觉图像算法 视频算法 PyTorch TensorFlow

大模型推理性能优化工程师

1-1.4万 诚迈科技股份有限公司
本科 3-5年 Attention 、GEMV CPU

深度学习算法工程师

1.6-3万 北京玖瑞科技有限公司
硕士 1-3年 机器视觉 图像算法 人工神经网络 OpenCV 人工智能 工业自动化/机器人 检测/认证/计量

AI 模型应用工程师

2-3万·13薪 智腾微电子
本科 PyTorch TensorFlow C++ Python 自然语言处理 图像算法 AI 部署工具链 NPU 算法工程化经验 开源项目经历
最新招聘
热门城市
热门职位
热门公司