机器人世界模型工程师（视觉三维重建+仿真环境搭建）

2-2.8万·14薪

南京江宁区
1-3年
本科
全职
招1人

职位描述

机器视觉VLA模型多模态算法三维重建视觉理解PyTorchOpenCVISAAC SIMPythonC语言人工智能

岗位职责
1. 负责从真实场景的视频、图片中提取环境内物品的三维模型、空间位置、几何关系，完成物体分类、属性标注及结构化处理。
2. 将标注后的场景数据、物体信息规范存入数据库，负责数据集的构建、清洗、标准化与维护。
3. 熟练使用Isaac Sim（或Omniverse）虚拟环境，高精度复现真实物理环境，包括场景布局、物体摆放、材质还原、光照调试等。
4. 在虚拟环境中设置合理摄像点位，部署各类VLA（Vision-Language-Action）模型，完成模型效果的复现、对比与初步评估。
5. 对接外包团队，负责外包成果（虚拟环境、模型训练、场景复现等）的验收、整合与迭代优化，确保符合公司技术需求。
6. 梳理“视频/图像→3D重建→仿真复现→模型对比”的标准化流程，编写相关技术文档、脚本，提升工作效率。
7. 配合团队完成机器人世界模型的迭代升级，参与相关技术方案的讨论与落地。
任职要求
（一）核心要求（必须满足）
1. 本科及以上学历，计算机、自动化、机器人工程、三维视觉、数字孪生等相关专业，1-3年相关工作经验（优秀应届生可放宽）。
2. 具备扎实的三维重建与视觉理解能力，能从单目/多目视频、图片中恢复场景三维结构、物体位姿及几何关系，了解深度估计、SLAM、NeRF/3DGS、Mesh重建等至少一类技术。
3. 熟练使用NVIDIA Isaac Sim（或Omniverse），熟悉linux 系统及工具链，能独立完成虚拟环境搭建、场景复现、相机位姿配置、传感器调试等工作。
4. 了解VLA模型基本原理，能在虚拟环境中部署、运行各类VLA模型，通过仿真相机视角完成模型效果的对比与初步量化。
5. 具备物体检测、语义分割、点云处理基础，能熟练完成物体分类、3D框标注、位姿标注等工作，有数据集构建、标注经验。
6. 掌握Python，C编程语言，熟悉OpenCV、PyTorch、Open3D/PCL等相关工具库，具备基本的工程落地与脚本编写能力。
7. 具备良好的沟通协调能力，能高效对接外包团队，清晰反馈需求、验收成果，有较强的问题解决能力和责任心。
8. 认同初创公司文化，愿意投入精力深耕技术，能接受一定的工作节奏，具备团队协作意识。
（二）加分项
1. 有机器人世界模型、具身智能相关项目经验，熟悉RT-1、RoboFlow、Grounded-SAM等相关技术者优先。
2. 精通NeRF/3DGS等前沿三维重建技术，有复杂场景（室内/室外）3D重建落地经验者优先。
3. 熟悉ROS系统，有机器人仿真、感知相关开发经验，能独立完成仿真测试脚本编写者优先。
4. 有外包项目对接、验收经验，能制定标准化验收流程，具备一定的项目管理意识者优先。
5. 掌握数据库（如SQLite、Postgresql）使用，能独立完成数据结构化存储、查询与维护者优先。
6. 硕士及以上学历，有相关领域论文、专利或竞赛获奖经历者优先。
7. 能搭建，使用openclaw 类的自动化工具，编写相关skill，MCP call 者优先
简介：
我们是一家做机器人智能底层技术的初创公司，专注机器人感知、虚拟仿真训练和大模型落地，帮机器人更会看，更能学、更好用。

团队核心人员均为北大以及MIT背景，背靠北大研发资源。
公司已经拿到千万级融资，有真实落地场景和客户。