更新于 2月7日

多模态VLA模型开发工程师

1.5-2万
  • 成都双流区
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

机器人算法
岗位职责:
1. VLA模型研发与算法优化
1.1负责研发面向机器人操作的具身智能算法,重点设计与开发视觉-语言-动作(VLA)模型架构,构建从多模态感知到动作输出的端到端推理管线。
1.2 优化模仿学习、动作生成及强化学习算法,提升模型在复杂任务中的泛化能力、样本效率与长时序规划能力。
1.3 运用目标检测、语义分割、三维重建等计算机视觉技术,持续优化VLA模型的感知与理解模块。

2. 仿真验证、系统集成与实机对接
2.1 利用Isaac Sim、Gazebo等仿真工具进行算法预研、验证与优化,着力解决Sim2Real迁移挑战,实现算法向实机的 few-shot高效迁移。
2.2 负责算法在机器人系统的集成、部署与调试,核心包括与机械臂等执行器的深度对接:在ROS/ROS2框架下实现算法模块与机械臂控制器(如MoveIt、厂商SDK)的可靠通信与指令交互。
2.3 协同硬件与控制工程师,完成从算法输出到机械臂关节轨迹/力矩指令的转化、实机部署、联调及性能优化,解决实际运行中的时序、精度与稳定性问题。
3. 数据管道构建与训练管理
3.1 构建与管理用于VLA模型训练的多模态数据集(视觉、语言、力觉、运动轨迹等),其中包含从真实机械臂平台采集的交互数据;设计并实施数据清洗、增强及高效预训练流程。
3.2 管理与优化大规模分布式训练(多机多卡)任务,提升模型训练效率与资源利用率。
4. 技术探索与跨团队协作
4.1 紧密跟踪机器人操作、多模态模型、模仿与强化学习等领域的前沿进展,特别是与机器人本体控制、灵巧操作相关的技术,评估并将其创新性方法应用于实际业务场景。
4.2 协同产品、工程及硬件团队,推动算法在产品中的落地应用,负责相关技术方案的文档编写与知识传承。
任职要求:
基本要求:
1. 计算机、人工智能、机器人、自动化或相关专业,本科及以上学历。有VLA(如RT-2,
OpenVLA)、多模态大模型或具身智能相关项目经验者优先。
2. 深刻理解并具备以下至少两个领域的研发经验:视觉-语言多模态模型(VLM/VLA)、模仿学习与强化学习、机器人动作生成与规划。熟悉行为克隆、扩散策略、离线/在线强化学习(如PPO, SAC)等算法,并有实际应用经验。
3. 熟练掌握Python,精通PyTorch/TensorFlow等至少一种主流深度学习框架。具备扎实的编程和软件工程能力。掌握目标检测、语义分割、三维重建等计算机视觉算法,并能将其用于机器人感知任务。
4. 熟悉机器人操作系统ROS/ROS2,有在仿真环境(如Isaac Sim,
Gazebo)和真实机器人平台进行算法开发、部署与调试的实际经验。
加分项:
1. 具备与机械臂等执行器对接的实操经验,熟悉机器人运动学/动力学基础,了解MoveIt或类似运动规划框架,能实现算法与底层控制器的可靠集成与调试。
2. 对机器人技术和人工智能前沿保持高度热情,具备优秀的自主学习、分析问题和解决复杂技术难题的能力。
3. 具备良好的沟通能力和团队协作精神,能够与算法、硬件、控制等多背景同事有效合作,共同推动项目落地。
4. 在机器人顶级会议(如RSS, CoRL, ICRA, IROS)或人工智能顶级会议(如NeurIPS, ICML, CVPR)上有相关论文发表者优先。

工作地点

成都双流区AI创新中心

职位发布者

刘雅雯/人事经理

昨日活跃
立即沟通
公司Logo鼎桥技术有限公司
鼎桥成立于2005年,2011年成立全资子公司成都鼎桥(合称“鼎桥”),专注于行业客户通信解决方案的研发和推广。目前在北京、上海和成都三地设立研究中心,员工超过1800人,研发人员占比64%。鼎桥每年将销售收入的20%投入到研发领域,研发投入累计100亿,取得了优异的成果,鼎桥申请专利数量逾2000件,其中90%以上为发明专利;业务遍布全球100多个国家,服务800万行业客户。鼎桥将稳定高效的联接作为纽带,布局云与解决方案产品线、无线网络产品线、终端产品线、AI产品线四大业务板块,依托成熟的市场和销售经验、高质量的创新研发能力、可靠完善的生产交付和售后服务体系,致力成为行业联接解决方案的全球领导者。
公司主页