更新于 1月13日

AI部署优化工程师

1.5-2.5万
  • 北京海淀区
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

C++Python算法工程化嵌入式AI部署人工智能
1.负责将AI算法模型,通过工程化手段高效部署到多种硬件平台。主导模型的格式转换、量化与优化,熟练使用ONNX、TensorRT等工具链,实现模型从PyTorch/TensorFlow到嵌入式平台(如Jetson、RK系列)或NPU(如高通/MTK系列)的高效迁移。
2.设计混合量化策略(INT8/INT4/FP16),针对敏感层定制量化方案,将精度损失控制在1%以内,同时优化推理速度与内存占用。
3.开发基于C++/Python的高性能推理引擎,集成多线程、内存池等技术,提升端到端吞吐率与实时性。
4.构建定制化Linux系统:完成内核裁剪、驱动开发(如摄像头、NPU加速器)、文件系统定制,并优化启动时间与资源调度。
5.深入Linux内核机制,针对进程管理、内存分配等模块进行调优,确保算法在资源受限环境下的稳定性(如实时性任务处理)
6.熟悉硬件接口协议(UART、I2C、SPI、CAN),协同硬件团队完成板级开发与调试。
7.编写技术文档(如量化白皮书、部署手册),并支持算法团队理解硬件约束,推动算法设计阶段的工程化适配。
任职要求
1.本科及以上学历,计算机、电子工程、自动化等相关专业。
2.3年以上算法工程化或嵌入式AI部署经验,有大型项目落地案例(如智能驾驶、机器人、物联网设备)。
3.有多年ONNX Runtime/TensorRT量化实战经验。
4.熟悉NPU架构,具备针对芯片特性的量化方案定制能力。
5.精通嵌入式Linux开发全流程,包括内核配置、驱动开发、根文件系统构建。
6.熟练使用C++/Python,掌握Shell/CMake脚本编写,具备多进程/协程编程与性能剖析能力。
7.有高并发、低延迟系统设计经验,熟悉分布式架构与缓存机制。
8.强烈的工程落地导向,能平衡算法精度与部署效率的矛盾。
9.具备良好的问题解决能力和团队合作精神,能够承受工作压力。

工作地点

北京海淀区锦秋国际大厦A801

职位发布者

郭春杰/人事经理

立即沟通
公司Logo分音塔科技
【公司简介】北京分音塔科技有限公司(BABEL TECHNOLOGY),简称分音塔科技,成立于2016年7月15日,由清华大学团队、成功连续创业者成立,是一家专注于人工智能领域的高科技公司,致力于实现不同国家和民族之间跨语言同声传译,提供可穿戴智能设备、人工智能API综合解决方案和虚拟运营服务。基于普遍存在的跨语言沟通障碍和迫切的沟通需求,分音塔科技采用世界领先的人工智能技术,开发出准儿翻译机等系列可穿戴智能硬件产品和准儿翻译APP,并与中国、美国、日本、韩国、俄罗斯等世界上最先进的相关人工智能公司建立长期合作关系,构建全球沟通翻译第一平台。公司名称北京分音塔科技有限公司外文名称BABEL TECHNOLOGY总部地点北京成立时间2016年7月主要产品人工智能硬件-准儿翻译机,准儿翻译APP公司愿景分音塔科技,致力于成为世界上最优秀的口语翻译公司,让人类沟通无障碍。【产品背景】沟通是人类的基本需求,语言是最好的沟通媒介。国家旅游局数据统计,2016年我国入境游达1.38亿人次,出境游1.22亿人次,欧美、日本、韩国、东南亚地区成为中国游客首选的热门旅游地区。近年来,出入境旅游愈加火热,而出国自由行群体不到35%,语言不通是最大的限制因素之一。保守估计,旅游市场对翻译的需求已经超过千亿级别。【公司产品】针对庞大的市场需求,分音塔科技率先推出中国首款人工智能沟通翻译硬件——“准儿翻译机”,具有汉语、英语、日语、韩语、泰语等多语种实时同声翻译、高灵敏图片识别翻译、录音转写、日常用语离线包、旅行常用工具等强大功能。准儿翻译机目前有8项国家专利,采用世界领先的人工智能技术,独有口语优化技术和深度学习方法,非常适合口语翻译,准确率行业领先,而且越用越准;在中国、日本、北美、俄罗斯、泰国等设有大容量服务器,秒速翻译不延迟。准儿翻译机非常适合出国人群和来中国的外国人群,广泛适用于出行、购物、娱乐、交友、教育、学习等场景。
公司主页