更新于 2月12日

视觉感知模型工程师

1.5-2万
  • 成都双流区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

机器人
岗位职责:
1.核心算法研发与迭代
1.1 负责机器人视觉感知核心算法的研究、开发与迭代,涵盖基于图像/点云的目标检测、识别、跟踪、分割等任务。
1.2 深入探索基于多模态视觉-语言模型(VLM)的场景理解与事态感知技术(如复杂行为识别、异常事件检测等),提升机器人对动态环境的认知能力。
1.3 研究与开发多传感器(如多目相机、激光雷达)的时空对齐与融合感知算法,构建鲁棒、精确的环境理解系统。
2.算法工程化与系统部署
2.1 主导视觉算法从模型到产品级的工程化落地,负责模型的轻量化、推理加速及在嵌入式、机器人平台等边缘计算设备上的适配与优化。
2.2 设计与实现高实时性、高可用的视觉处理Pipeline,满足机器人低延迟、高并发的实时交互与决策需求。
2.3 推动模型蒸馏、量化等技术的应用,平衡算法性能与计算资源占用。
3.数据体系建设与模型持续优化
3.1 构建和完善视觉数据闭环体系,主导或参与关键业务场景的数据采集、标注、清洗、增强及管理工作,以数据驱动算法迭代。
3.2 系统性分析与解决算法长尾问题,针对遮挡、快速运动、弱光照、密集目标交互等复杂业务场景,从模型结构、损失函数、训练策略等多维度进行持续优化,提升模型泛化能力与场景适应性。
4. 技术调研与创新落地
4.1 紧密跟踪计算机视觉(如YOLO系列、DETR系列模型)与多模态感知领域的前沿技术演进,评估其在机器人业务中的应用潜力。
4.2 负责新技术、新方案的预研、原型验证与工程化导入,为产品进行前瞻性的技术布局。
5. 跨团队协作与系统集成
5.1与机器人软件、硬件、控制系统及AI团队紧密协作,完成感知算法在真实机器人平台上的集成、调试、性能优化与长期维护。
5.2协同各团队进行系统级联调与问题攻关,确保整体系统的稳定、可靠交付与性能提升
任职要求:
基本要求:
1.本科及以上学历,计算机科学、电子工程、自动化、机器人、应用数学等相关专业。3年以上计算机视觉或机器人感知算法研发经验,有带领技术模块或独立负责完整项目经验者优先。
2.算法基础:扎实的机器学习、深度学习理论基础,熟悉计算机视觉核心领域(检测、跟踪、分割、Re-ID等)的经典与前沿算法。
3.模型开发:精通PyTorch或TensorFlow等至少一种主流深度学习框架,具备丰富的模型训练、调参、优化及实验设计经验。
4.工程能力:具备较强的算法工程化与落地能力,熟悉模型轻量化(如剪枝、量化、蒸馏)、推理加速(如TensorRT、OpenVINO、ONNX)技术,有C++/Python高性能代码开发与优化经验。
5.技术广度:熟悉目标检测、多目标跟踪(MOT)领域的主流架构(如YOLO系列、DETR系列、ByteTrack等),并对其演进有深入理解。对视觉-语言模型(VLM)、多模态感知、传感器融合有研究或项目经验者优先。
6.数据处理:具备良好的数据处理和分析能力,熟悉数据采集、标注、清洗、增强全流程,能利用数据驱动解决模型的长尾问题。

加分项:
1.有完整的机器人、自动驾驶或相关领域的视觉感知算法落地项目经验,熟悉从算法研发到嵌入式/边缘端部署的全流程。
2.具备优秀的复杂问题分析、拆解与解决能力,能够针对实际场景中的难点(如遮挡、运动模糊、光照变化等)进行系统性优化。
3.具备优秀的技术调研、文献阅读、原型快速验证及技术选型能力。
4.有较强的责任心和自驱力,对技术有热情,乐于接受挑战,能适应快速迭代的开发节奏。
5.在顶级会议(CVPR、ICCV、ECCV、IROS、ICRA等)或期刊上发表过相关论文。
6.具备良好的跨团队沟通与协作能力,能够清晰阐述技术方案并与软件、硬件团队高效合作。

工作地点

成都双流区AI创新中心

职位发布者

刘雅雯/人事经理

三日内活跃
立即沟通
公司Logo鼎桥技术有限公司
鼎桥成立于2005年,2011年成立全资子公司成都鼎桥(合称“鼎桥”),专注于行业客户通信解决方案的研发和推广。目前在北京、上海和成都三地设立研究中心,员工超过1800人,研发人员占比64%。鼎桥每年将销售收入的20%投入到研发领域,研发投入累计100亿,取得了优异的成果,鼎桥申请专利数量逾2000件,其中90%以上为发明专利;业务遍布全球100多个国家,服务800万行业客户。鼎桥将稳定高效的联接作为纽带,布局云与解决方案产品线、无线网络产品线、终端产品线、AI产品线四大业务板块,依托成熟的市场和销售经验、高质量的创新研发能力、可靠完善的生产交付和售后服务体系,致力成为行业联接解决方案的全球领导者。
公司主页