更新于 1月19日

高级AI模型工程化工程师

6-8万·14薪
  • 上海闵行区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

C++CUDA算子
工作职责
负责深度学习模型的工程化落地,包括模型转换、量化、推理优化及部署。
使用ONNX、TensorRT等工具对模型进行优化,提升推理性能并降低资源消耗。
针对点云、Mesh等3D数据,设计和实现高效的预处理、后处理算法。
开发和维护高性能的C++推理引擎,确保其在GPU上的稳定运行。
与算法团队协作,理解模型需求并提供工程化支持,确保模型从训练到部署的无缝衔接。
持续优化现有系统,解决性能瓶颈,提升系统的可扩展性和鲁棒性。
编写高质量的技术文档,分享最佳实践,推动团队技术能力的提升。
任职要求
必备技能:
5年以上C++开发经验,熟悉现代C++特性(C++11/14/17)。
熟悉深度学习模型推理优化技术,如ONNX、TensorRT、OpenVINO等。
了解模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TensorRT优化、Flash Attention 推理优化等;
熟悉深度学习框架(如PyTorch、TensorFlow),了解模型训练与推理的基本流程。
熟悉 TensorFlow/PyTorch 模型的训练和部署,了解混合精度训练、分布式训练等训练加速方法优先。
对点云(Point Cloud)、Mesh等3D数据处理算法有实际项目经验。
熟悉多线程编程、内存优化及高性能计算技术。
具备良好的代码风格和工程化能力,熟悉CI/CD流程及版本控制工具(如Git)。
加分项:
熟悉CUDA编程,能够编写高性能的GPU加速代码。
了解计算机图形学(Computer Graphics)相关算法,如渲染、几何处理等。
有实际项目中使用PCL(Point Cloud Library)、Open3D等点云处理库的经验。
对AI模型量化、剪枝、蒸馏等压缩技术有深入理解和实践。

工作地点

上海闵行区漕河泾科技绿洲-四期

职位发布者

韩晨/团队负责人

三日内活跃
立即沟通
公司Logo南京信然盛元企业管理有限公司
南京信然盛元企业管理有限公司是经人事局批准的专业从事专注领域包括制药、器械、制造、人工智能、IT、新能源、汽车、消费品、农业、金融等机构中高端猎头服务、代理招聘、人才测评与技术咨询的机构,是知名外资企业、国内上市集团、百强企业、新兴企业等合作客户。我们的核心价值观是:求真务实、专注专业、合作共赢。我们核心竞争力是:以专业顾问团队,以国际化服务模式,在企业与人才之间搭建双向沟通桥梁,建立起合作共赢平台。公司的核心专家顾问团队具有本行业8年以上工作经验,从事过大型企业相关管理工作,时刻关注国内外最新法规政策,并参与各类法规培训与行业会。
公司主页