更新于 今天

大模型强化学习系统实习生

面议
  • 北京朝阳区
  • 经验不限
  • 硕士
  • 全职
  • 招2人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 团队执行强
  • 人际关系好
  • 交通便利
  • 五险一金
  • 实力大公司

职位描述

基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
参与Agentic RL系统的工程研究和落地,工作包括/不限于:Agentic RL系统部分功能的设计和实现、RL性能优化、RL算法实现、数据合成链路设计和实现等
跟进公司内外AI Agent方向的技术演进,进行Agentic RL相关的技术调研。
岗位基本需求
硕士及以上学历,计算机及相关专业;
熟悉机器学习基础,对Transformer模型原理、强化学习原理有深入了解;
有强化学习框架开发经验,有训练框架如Megatron、推理框架如SGLang/vLLM开发经验;
熟悉Ray等分布式框架;
熟悉Python/C++开发,熟悉异步编程;扎实的编程能力,熟悉算法和数据结构,熟悉计算机基础理论。
具备以下者优先
在大语言模型、基础模型、世界模型、强化学习等方向,参与过开源、大影响力项目者优先。
岗位亮点
有机会接触业界前沿AI技术,提升专业能力。
参与大型项目的开发,获得实战经验。

工作地点

北京朝阳区美团

认证资质

营业执照信息

职位发布者

舒靖然/HR

当前在线
公司Logo北京三快在线科技有限公司公司标签
美团是一家科技零售公司。美团以“零售+科技”的战略践行“帮大家吃得更好,生活更好”的公司使命。自2010年3月成立以来,美团持续推动服务零售和商品零售在需求侧和供给侧的数字化升级,和广大合作伙伴一起努力为消费者提供品质服务。2018年9月20日,美团在港交所挂牌上市。美团始终以客户为中心,不断加大在新技术上的研发投入。美团会和大家一起努力,更好承担社会责任,更多创造社会价值。
公司主页