更新于 3月18日

模型部署工程师

面议
  • 成都武侯区
  • 3-5年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 免费班车

职位描述

深度学习机器学习大模型算法人工智能
岗位职责
1. 模型优化与部署:负责AI模型的端侧部署优化,包括模型量化、裁剪、蒸馏等技术,提升模型在机器人的嵌入式边缘计算硬件上的推理速度与效率,降低资源消耗;
2. 异构硬件适配与优化:在异构的硬件平台(如ARM、GPU、NPU等),利用 TensorRT、ONNXRuntime、TFLite、MNN、NCNN 等框架实现推理加速,确保模型在多场景下的稳定性与兼容性;
3. 性能调优与工程化:通过多进程/线程优化、内存管理、计算图优化等技术,结合 CUDA、NEON 等底层优化工具,提升端侧推理性能;参与模型部署流程的持续优化,推动自动化部署工具链建设;
4. 算法协同与测试:与算法团队紧密合作,完成模型转换、自定义算子开发及推理效果调优;在真实硬件平台上进行算法部署测试,分析并解决性能瓶颈问题;
5. 技术文档与创新:编写技术文档、研究报告,总结优化经验;跟踪AI部署领域的前沿技术,探索新技术在端侧的应用,推动技术创新与落地。
任职条件
1. 本科及以上学历,年龄45周岁以下,熟悉主流深度学习框架,如:pytorch,tensorflow,及推理部署引擎;
2. 具备量化经验,掌握模型量化能力;
3. 具备cuda编程能力,熟悉主流AI芯片架构。

工作地点

成都武侯区长虹科技大厦

认证资质

营业执照信息

职位发布者

彭女士/人才经理

刚刚活跃
立即沟通
公司Logo四川长虹电子控股集团有限公司
长虹创始于1958年,历经保军转民、相关多元化、国际化三次转型,已发展成为集智能家电、核心部件、ICT服务、新能源、半导体等产业的综合型千亿跨国企业集团。旗下拥有七家上市公司、三家新三板公众公司,创新产品和服务覆盖全球160余个国家和地区,服务已超5亿多用户。目前,长虹位列中国电子信息百强第10位,中国制造业500强第85位,世界品牌500强第285位。当前,正加快实施面向物联网的数字化转型,并朝着“全球具有重要影响力的电子信息科技企业集团”奋力迈进。
公司主页