更新时间 6月5日

VLM/VLA & 感知高性能部署工程师

3.5-5.5万·14薪
  • 上海 浦东新区
  • 经验不限
  • 本科
  • 全职

职位描述

语音识别多模态算法深度学习PythonC++自动驾驶人工智能工业自动化/机器人
岗位职责
负责人形机器人 / 车载端VLM、VLA 视觉语言动作大模型、2D/3D 感知模型端侧落地,基于 NVIDIA Jetson Orin 系列硬件完成模型移植、权重优化、工程部署;
主导模型全链路量化:FP16/BF16→W8A8/W4A16/AWQ 量化落地,使用 TensorRT、TRT-LLM 完成引擎编译,调优maxInputLen、maxKVCacheCapacity、KV Cache复用等关键参数,解决量化掉精度、显存溢出、推理时延超标问题;
结合 ROS2/Humble 完成多模态模型推理服务封装,打通感知输入→VLM 推理→机器人控制指令输出全链路,对接 Isaac Sim 仿真数据闭环;
针对 Orin GPU+NPU 异构算力做算子裁剪、算子融合、显存池优化,优化 Prefill/Decode 推理速度,落地 RTF、FPS、首包时延等性能指标;
跟进前沿 VLA/Track-VLA 类模型部署迭代,对接算法团队,梳理部署瓶颈,输出标准化部署基线与量化规范。
任职要求
本科及以上,计算机、自动化、机器人、电子等相关专业,机器人 / 自动驾驶落地经验优先;
有 VLM/VLA/BEV/ 图像检测分割等感知算法落地经验,熟悉大模型自回归推理原理、KV Cache 机制;
精通 TensorRT、TRT-LLM,熟练各类 INT8/W8A8 量化方案落地,有 Jetson Orin 平台量产部署实战;
机器人/自动驾驶/芯片符合行业经验优先
熟练 C++/Python,熟悉 ROS/ROS2 开发,能独立完成推理节点封装、多机 / 板间通信调试;
熟悉 CUDA 编程优先,懂 FlashAttention、SmoothQuant、模型剪枝等优化手段优先。

工作地点

工作地点
上海市浦东新区祖冲之路2305号
位置图标
完善简历

公司信息

北京维泛智能科技有限公司

未融资 · 20-99人 · 半导体/芯片 已审核 已审核

20 个在招职位

工商信息

企业名称 北京维泛智能科技有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 殷积磊
经营状态 存续
成立时间 2025-05-20
注册资本 165.8万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

高级算法工程师

2.5-5万·13薪 上海雨浓医药科技有限公司
本科 1-3年 机器学习 多模态算法 朴素贝叶斯 逻辑回归 线性回归 人工智能

AI 算法工程师(时序方向)(J10215)

2-4万·15薪 为恒智能科技股份有限公司
本科 3-5年 深度学习 机器学习 Python 时序预测 LSTM Transformer ARIMA PyTorch TensorFlow

AI Agent 研发工程师

1.5-2万 深圳市法本信息技术股份有限公司
本科 3-5年 深度学习 机器学习 AGENT 人工智能

算法评测工程师 (五险一金,双休)

1-1.2万 深圳市法本信息技术股份有限公司
大专 3-5年 新能源/燃油整车研发制造 新能源/燃油车零部件 汽车4S店/经销商 五险一金 早9晚6 周末双休 法定节假日休 年度体检

AIGC算法工程师

1.2-1.6万 长春风火轮科技有限公司
本科 3-5年 大模型算法 PyTorch TensorFlow Python 新能源/燃油整车研发制造

AI算法工程师

1.5-2.5万 山东宏济堂制药集团股份有限公司
硕士 3-5年 深度学习 图像算法 机器视觉 自然语言处理 知识图谱 Python C++ PyTorch TensorFlow OpenCV 大模型算法 GPT RoBERTa 人工智能 生物/制药 入职签订劳动合同 五险一金 职工宿舍 员工食堂 免费班车 健康体检 生日礼券 节日福利 法定节假日 年假 婚假 哺乳假 各种假期 完善的薪酬福利体系 奖励政策

AI开发工程师

1.6-2.2万 科珠(广州)科技有限公司
本科 3-5年 AI全栈开发 多轮交互功能 向量数据库 大模型算法 Python 计算机软件
最新招聘
热门城市
热门职位
热门公司