更新于 今天

AI算法工程师(模型部署与调优)

1.8-2.5万
  • 成都郫都区
  • 5-10年
  • 硕士
  • 全职
  • 招1人

职位描述

大模型算法PyTorchTensorFlow昇腾平台人工智能计算机软件
岗位职责:
1、负责大模型从容器构建到服务化部署的全流程设计与实施,确保模型在昇腾硬件平台上稳定、高效运行。
2、针对昇腾硬件架构,对已部署模型进行深度性能优化,包括算子优化、推理引擎调优、内存管理等,突破推理性能瓶颈。
3、构建模型部署与调优的标准化流程和工具链,形成可复用的技术方案和最佳实践。
4、跟踪并应用业界最新的模型部署与性能优化技术,持续提升公司 AI 推理服务的效率和竞争力。
5、作为核心成员参与 “模型部署和调优赛”,完成流程部署任务及能优化挑战。
任职要求:
1、硕士及以上学历,或本科学历且具备 5 年以上相关工作经验,计算机科学与技术、软件工程、人工智能等相关专业。
2、5 年以上 AI 相关领域工作经验,有大模型部署、AI 应用开发或昇腾平台开发经验者优先。
3、精通至少一种主流深度学习框架(如 PyTorch、TensorFlow),熟悉模型训练与推理流程。
4、熟悉容器化技术(如 Docker)及服务化部署(如 FastAPI、Triton Inference Server),有相关项目落地经验。
5、熟悉昇腾 AI 软硬件平台(如 Ascend C、CANN),有大模型在昇腾硬件上部署和性能优化经验者优先。
6、具备扎实的 C/C++/Python 编程能力,熟悉算子开发与优化,对性能调优有深刻理解。
7、了解模型压缩、量化、蒸馏等技术,有相关实践经验者优先。

工作地点

四川省成都市郫都区西芯大道28号

职位发布者

刘玉康/人事经理

昨日活跃
立即沟通
公司Logo创意信息
创意信息技术股份有限公司成立于1996年,2014年深交所创业板挂牌上市(股票代码:300366),是国内领先的创新型科技企业。公司始终坚持以“技术立业”为本,坚定不移地走“自主可控”技术创新发展之路,经过多年发展,公司已形成基于数字化转型的全栈核心能力。公司拥有操作系统、数据库、大数据等自主可控核心技术与软件产品,同时拥有5G、物联网、人工智能、云/边缘计算等新型信息技术及解决方案,已广泛服务于政府、运营商、能源、金融、交通、教育、军队等多个领域超过500个大型客户。公司总部位于成都和北京,服务网络已覆盖全国及海外部分地区,并与电子科技大学等高校合作建设了技术研发中心。
公司主页