更新于 3月2日

机器人世界模型工程师(视觉三维重建+仿真环境搭建)

2-2.8万·14薪
  • 南京江宁区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

机器视觉VLA模型多模态算法三维重建视觉理解PyTorchOpenCVISAAC SIMPythonC语言人工智能
岗位职责
1. 负责从真实场景的视频、图片中提取环境内物品的三维模型、空间位置、几何关系,完成物体分类、属性标注及结构化处理。
2. 将标注后的场景数据、物体信息规范存入数据库,负责数据集的构建、清洗、标准化与维护。
3. 熟练使用Isaac Sim(或Omniverse)虚拟环境,高精度复现真实物理环境,包括场景布局、物体摆放、材质还原、光照调试等。
4. 在虚拟环境中设置合理摄像点位,部署各类VLA(Vision-Language-Action)模型,完成模型效果的复现、对比与初步评估。
5. 对接外包团队,负责外包成果(虚拟环境、模型训练、场景复现等)的验收、整合与迭代优化,确保符合公司技术需求。
6. 梳理“视频/图像→3D重建→仿真复现→模型对比”的标准化流程,编写相关技术文档、脚本,提升工作效率。
7. 配合团队完成机器人世界模型的迭代升级,参与相关技术方案的讨论与落地。
任职要求
(一)核心要求(必须满足)
1. 本科及以上学历,计算机、自动化、机器人工程、三维视觉、数字孪生等相关专业,1-3年相关工作经验(优秀应届生可放宽)。
2. 具备扎实的三维重建与视觉理解能力,能从单目/多目视频、图片中恢复场景三维结构、物体位姿及几何关系,了解深度估计、SLAM、NeRF/3DGS、Mesh重建等至少一类技术。
3. 熟练使用NVIDIA Isaac Sim(或Omniverse),熟悉linux 系统及工具链,能独立完成虚拟环境搭建、场景复现、相机位姿配置、传感器调试等工作。
4. 了解VLA模型基本原理,能在虚拟环境中部署、运行各类VLA模型,通过仿真相机视角完成模型效果的对比与初步量化。
5. 具备物体检测、语义分割、点云处理基础,能熟练完成物体分类、3D框标注、位姿标注等工作,有数据集构建、标注经验。
6. 掌握Python,C编程语言,熟悉OpenCV、PyTorch、Open3D/PCL等相关工具库,具备基本的工程落地与脚本编写能力。
7. 具备良好的沟通协调能力,能高效对接外包团队,清晰反馈需求、验收成果,有较强的问题解决能力和责任心。
8. 认同初创公司文化,愿意投入精力深耕技术,能接受一定的工作节奏,具备团队协作意识。
(二)加分项
1. 有机器人世界模型、具身智能相关项目经验,熟悉RT-1、RoboFlow、Grounded-SAM等相关技术者优先。
2. 精通NeRF/3DGS等前沿三维重建技术,有复杂场景(室内/室外)3D重建落地经验者优先。
3. 熟悉ROS系统,有机器人仿真、感知相关开发经验,能独立完成仿真测试脚本编写者优先。
4. 有外包项目对接、验收经验,能制定标准化验收流程,具备一定的项目管理意识者优先。
5. 掌握数据库(如SQLite、Postgresql)使用,能独立完成数据结构化存储、查询与维护者优先。
6. 硕士及以上学历,有相关领域论文、专利或竞赛获奖经历者优先。
7. 能搭建,使用openclaw 类的自动化工具, 编写相关skill,MCP call 者优先
简介:
我们是一家做机器人智能底层技术的初创公司,专注机器人感知、虚拟仿真训练和大模型落地,帮机器人更会看,更能学、更好用。

团队核心人员均为北大以及MIT背景,背靠北大研发资源。
公司已经拿到千万级融资,有真实落地场景和客户。

工作地点

江宁区北京大学南京校友之家

职位发布者

陈洁/HRBP主管

刚刚活跃
立即沟通