职位描述
岗位职责:
1、负责整车各类深度学习模型(CNN/LLM/VLM)在车规级芯片(如高通、华为等平台)上的移植与工程化落地;
2、负责端侧模型的量化、剪枝、蒸馏及算子优化;解决模型在嵌入式环境下的推理延迟、内存占用、功耗发热等核心性能瓶颈;
3、探索和利用车端芯片的异构算力(CPU/GPU/NPU/DSP),设计高效的并行计算策略,最大化硬件利用率;
4、搭建自动化的模型转换与部署工具链,制定模型上车的性能标准与验收规范,提升算法团队的工程交付效率。
任职要求:
1、本科及以上学历,计算机、电子工程或自动化相关专业;3年以上高性能计算、模型部署或嵌入式AI开发经验;
2、精通 C/C++ 及 Python 编程;熟悉主流推理引擎(如 TensorRT, SNPE, MNN 等)及模型压缩技术;深入理解 ARM/NPU 等芯片架构特性;
3、具备优秀的工程思维和问题排查能力,能够应对资源受限环境下的极致性能挑战,对新技术敏感。
查看全部