更新于 今天

视觉Agent大模型算法专家

面议
  • 上海
  • 1-3年
  • 硕士
  • 全职
  • 招2人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 团队执行强
  • 人际关系好
  • 交通便利
  • 五险一金
  • 实力大公司

职位描述

基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 负责视觉Agent系统的全链路设计与开发,构建融合多模态感知、动态决策与自动化执行的视觉智能系统,推动复杂场景下的图文多模态/视频理解、交互与生成能力。
2. 负责视觉Agent核心算法的研发与优化,包括但不限于多模态大模型视觉感知、图像生成、多模态对齐(如文本-图像-视频)等方向,持续提升系统的鲁棒性与泛化能力。
3. 研发视觉Agent的协作机制,支持多智能体协同任务(如跨模态推理、工具调用),优化模型在实时性、资源效率及长上下文处理中的表现。
4. 研发大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。
5. 结合业务场景设计并落地视觉Agent应用,赋能业务智能化升级。
6. 跟踪计算机视觉与大模型交叉领域的前沿技术,探索创新技术在实际场景中的落地路径。
岗位基本需求
1. 计算机科学、人工智能、电子工程等相关专业硕士及以上学历,具有计算机视觉或视觉Agent相关研发经验。
2. 扎实的算法基础,熟悉主流视觉模型及多模态大模型,具备模型调优与轻量化部署经验。
3. 深入理解主流Agent框架原理,在任务规划、工具调用、策略优化等方向有实际项目经验;
4. 优秀的分析和解决问题的能力,项目推动力和团队协作能力。
具备以下者优先
1. 在视觉Agent相关领域发表顶会论文(CVPR/ICCV/ECCV/NeurIPS等)或主导过落地项目。
2. 开源社区贡献者或重要竞赛获奖者。
3. 具备大模型与视觉技术融合经验,具有突出的产品建设思维。
岗位亮点
1. 参与美团本地生活场景的视觉智能化革新,直接赋能数亿用户与千万商家。
2. 探索视觉Agent在生成式AI时代的核心技术,打造行业标杆级应用。
3. 在快速发展的领域中积累经验,成为大模型和智能体领域的专家。

工作地点

上海杨浦区

职位发布者

舒靖然/HR

当前在线
公司Logo北京三快在线科技有限公司公司标签
美团是一家科技零售公司。美团以“零售+科技”的战略践行“帮大家吃得更好,生活更好”的公司使命。自2010年3月成立以来,美团持续推动服务零售和商品零售在需求侧和供给侧的数字化升级,和广大合作伙伴一起努力为消费者提供品质服务。2018年9月20日,美团在港交所挂牌上市。美团始终以客户为中心,不断加大在新技术上的研发投入。美团会和大家一起努力,更好承担社会责任,更多创造社会价值。
公司主页