雇员点评标签
职位描述
VLM
一、岗位职责
- 负责起重机多机协同场景下视觉大模型(VLM)算法研发,涵盖目标检测 / 分割、姿态估计、行为理解、场景建模及异常预警等核心模块,支撑多机作业全域感知需求。
- 基于视觉大模型构建多机位姿关联、干涉风险预判、协同意图理解能力,为集群协同路径规划、安全防撞与智能决策提供算法支撑。
- 开展视觉大模型的预训练、微调(SFT/PEFT)、量化蒸馏及推理加速优化,适配工业强振动、强光照、复杂遮挡等严苛作业工况。
- 完成视觉大模型从算法原型到工程化落地的全流程开发,对接控制、电控等团队,实现 “感知 — 决策 — 控制” 全链路系统集成。
- 搭建吊装场景专属视觉数据集与算法评估体系,持续迭代优化模型鲁棒性、精度与实时性,保障多机协同作业稳定性。
- 跟踪视觉大模型与多模态技术前沿方向,推动核心算法技术创新,形成专利与技术壁垒。
- 学历与经验:计算机、自动化、电子信息、人工智能等相关专业硕士及以上学历,3 年及以上视觉大模型 / 计算机视觉算法研发实战经验。
- 技术能力:
- 精通 PyTorch/TensorFlow 等深度学习框架,深入理解 Transformer、CNN、多模态大模型核心架构与原理。
- 熟练掌握目标检测、语义分割、目标跟踪、三维视觉及多传感器融合(视觉 + 激光雷达)等技术栈。
- 具备视觉大模型(VLM)研发、微调、量化蒸馏及部署(TensorRT/TorchScript)全流程经验者优先。
- 工程能力:
- 具备模型训练调优、性能优化及端边云部署实战经验,能解决工业场景下模型实时性、资源占用等工程问题。
- 熟练使用 Python/C++ 进行算法开发,可独立完成算法原型设计、代码实现与测试。
工作地点
广州海珠区树根科技大厦

公司信息
公司介绍
三一主营业务是以“工程”为主题的装备制造业,覆盖混凝土机械、挖掘机械、起重机械、筑路机械、桩工机械、风电设备、港口机械、石油装备、煤炭设备、精密机床等全系列产品,目前,三一挖掘机械、桩工机械、履带起重机械、移动港口机械、路面机械、煤炭掘进机械为中国品牌,混凝土机械为全球品牌。
工商信息
企业名称 三一集团有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 唐修国
经营状态 存续
成立时间 2000-10-18
注册资本 3.23亿元
认证资质
营业执照信息

更新于 4月16日


