AI部署优化工程师/AI编译器工程师（委托招聘）

2.3-4.5万

无锡新吴区
1-3年
硕士
全职
招2人

职位描述

人工智能

岗位职责
1、AI软件栈的架构设计、开发与优化，负责从模型接入、图优化、算子实现到运行时调度的完整AI软件栈的核心模块开发。
2、主导TFLite、ONNX Runtime、Paddle Lite等推理引擎在自研芯片上的端到端移植、适配与稳定性保障。
3、进行系统级深度优化，包括但不限于：模型图层的算子融合、常量折叠、内存复用优化等。
4、设计与实现针对芯片内存 hierarchy（缓存、DDR）的高效数据搬运策略，极致压榨硬件带宽。
5、负责核心神经网络算子（如Conv、Pooling、Matmul等）在NPU/GPU/DSP/CPU上的高性能实现，充分利用硬件特性（如张量核心、矢量指令）。
6、开发与优化模型编译工具链，实现自动化的计算图分割、调度与异构计算任务分配。
7、参与或主导面向自研硬件指令集的代码生成与优化。
8、深化QAT开发：不仅实现标准训练后量化（PTQ），更需开发完整的量化感知训练（QAT）流程与工具，解决模型在低精度（INT8/INT4）下的精度损失问题。
9、为战略客户的关键AI模型提供深度的适配、调优与部署支持，解决复杂技术难题，成为客户信赖的技术专家。
10、编写详尽的技术文档、最佳实践指南和示例代码，降低开发门槛，赋能客户与合作伙伴。
11、持续跟踪AI框架、编译器（TVM/MLIR）、芯片设计等领域的前沿动态，进行技术预研并将其价值引入产品路线图。
12、使用高级性能分析工具（如Perf, VTune，自定义Profiler）进行系统级瓶颈定位，推动软硬件协同优化。

任职资格

1、计算机科学、电子工程、人工智能、数学等相关专业硕士及以上学历（特别优秀的本科生可放宽）。
2、精通C++/C，熟练使用Python进行脚本开发、原型验证和自动化工具构建。
3、熟悉Linux内核驱动模型，具备一定的底层系统调试能力（如使用gdb, perf, ftrace）。
4、熟悉至少一种主流AI框架（PyTorch或TensorFlow）的底层架构、计算图表示和运行时机制。
5、熟悉CNN、Transformer等主流模型的原理和计算特性。对模型量化和压缩理论有深入理解。
6、熟悉计算机体系结构，对CPU/GPU/NPU的微架构、内存子系统、缓存一致性、数据并行有深刻理解。
7、拥有AI模型在边缘设备或芯片上部署和优化的实战经验，深刻理解TFLite、ONNX Runtime等推理引擎的内部原理。
8、有AI编译器（TVM、MLIR、XLA等）的开发或深度定制经验优先。

工作地点

无锡新吴区梅村街道

认证资质

营业执照信息

完善一份简历
1736万+企业在线搜索，780万+海量职位精准推荐

相似职位

高级光谱算法工程师2-3万
无锡 - 新吴
无锡谱视界科技有限公司
大模型应用开发工程师（AI 全栈方向）1.5-2.5万·13薪
无锡 - 梁溪
无锡大禹科技有限公司
运动控制算法2.5-4万·15薪
无锡 - 新吴
无锡先导智能装备股份有限公司
算法工程师（运动控制&伺服驱动开发）1.8-3万·15薪
无锡 - 滨湖
无锡福艾德自动化科技有限公司
运动控制算法工程师2-4万
无锡 - 锡山
台铃科技股份有限公司
AI编译器工程师（委托招聘）3-5.5万
无锡 - 滨湖
无锡市人才服务中心

查看更多相似职位

职位发布者

杜林/人事经理

昨日活跃

立即沟通

无锡市人才服务中心

无锡市人才服务中心为无锡市人力资源和社会保障局直属公益一类事业单位，主要负责全市人力资源统计发布和调查分析工作，组织实施各类公益性人力资源招聘活动；落实全市高层次人才交流和支持政策以及全市高校毕业生的引进和支持政策，开展青年人才能力提升培训和优秀青年储备人才人事管理；组织海外高层次人才引才引智和联谊交流活动，提供在锡留学人员管理服务。

公司主页

关于我们: 公司介绍; 联系我们; 诚聘英才

产品与服务: 人才招聘; 企业招聘

使用与帮助: 账号注销; 意见反馈; 发票制度; 防骗指南; 法律协议; 资质公示

智联招聘更懂你的价值

智联app小程序官方微信企业版APP

京ICP备12025925号京ICP证010207号

京公网安备 11010502059392号人力资源许可证:1101051996081号

网上有害信息举报专区违法不良信息举报电话:400-885-9898 关爱未成年举报热线:400-885-9898-3

朝阳区人力资源与社会保障局监督电话

网络110报警服务电子营业执照