职位描述
视觉图像算法机器人算法运动控制算法语音处理运动规划路径规划机器避障人形机器人人工智能计算机软件计算机硬件
岗位职责:
- 研发基于多模态大模型(VLM、VLA、LMM)的场景理解、VQA与任务规划算法。
- 实现大模型对机器人动作序列生成与底层控制的端到端影响,探索World Model的应用。
- 构建与优化具身智能大模型的微调与提示词框架,利用仿真与真实世界数据进行迭代。
- 推动算法在仿真(如Isaac Gym) 与实物平台上的部署与性能调优,解决Sim2Real鸿沟。
- 硕士及以上学历,具备扎实的深度学习、Transformer架构及多模态建模理论基础。
- 精通PyTorch,拥有大语言模型或多模态大模型的微调或应用开发经验。
- 熟悉机器人学基础(运动学、动力学)及ROS框架。
- 在以下一个或多个领域有深入研究:视觉语言模型、机器人操作、模仿学习、强化学习。
展开该职位详情




