更新于 今天

大模型强化学习系统实习生

面议
  • 北京 朝阳区
  • 经验不限
  • 硕士
  • 全职
  • 招2人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 团队执行强
  • 人际关系好
  • 交通便利
  • 五险一金
  • 实力大公司

职位描述

基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
参与Agentic RL系统的工程研究和落地,工作包括/不限于:Agentic RL系统部分功能的设计和实现、RL性能优化、RL算法实现、数据合成链路设计和实现等
跟进公司内外AI Agent方向的技术演进,进行Agentic RL相关的技术调研。
岗位基本需求
硕士及以上学历,计算机及相关专业;
熟悉机器学习基础,对Transformer模型原理、强化学习原理有深入了解;
有强化学习框架开发经验,有训练框架如Megatron、推理框架如SGLang/vLLM开发经验;
熟悉Ray等分布式框架;
熟悉Python/C++开发,熟悉异步编程;扎实的编程能力,熟悉算法和数据结构,熟悉计算机基础理论。
具备以下者优先
在大语言模型、基础模型、世界模型、强化学习等方向,参与过开源、大影响力项目者优先。
岗位亮点
有机会接触业界前沿AI技术,提升专业能力。
参与大型项目的开发,获得实战经验。

工作地点

工作地点
北京朝阳区美团
位置图标
完善简历

公司信息

北京三快在线科技有限公司

已上市 · 10000人以上 · 产业互联网平台 已审核 已审核

3615 个在招职位

公司介绍

美团是一家科技零售公司。美团以“零售+科技”的战略践行“帮大家吃得更好,生活更好”的公司使命。自2010年3月成立以来,美团持续推动服务零售和商品零售在需求侧和供给侧的数字化升级,和广大合作伙伴一起努力为消费者提供品质服务。2018年9月20日,美团在港交所挂牌上市。美团始终以客户为中心,不断加大在新技术上的研发投入。美团会和大家一起努力,更好承担社会责任,更多创造社会价值。

工商信息

企业名称 北京三快在线科技有限公司
企业类型 有限责任公司(港澳台法人独资)
法人代表 穆荣均
经营状态 存续
成立时间 2011-05-06
注册资本 50.46亿美元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

高级JAVA开发工程师(J10554)

1.8-3万·14薪 卓望信息技术(北京)有限公司
本科 5-10年 Python Spring MySQL 机器学习

软件工程师

8000-15000元 北京航管软件技术有限公司
本科 软件/IT服务 计算机软件 云计算

Java开发工程师

1.5-2万 南京绛门信息科技有限公司
本科 5-10年 Spring MySQL SPRINGBOOT 电网 计算机软件

系统软件开发工程师

1.2-1.8万·13薪 北京华大智宝电子系统有限公司
本科 3-5年 Python Java Redis MySQL PostgreSQL SPINGBOOT 物联网 计算机软件 人工智能

Java开发工程师

1.8-2万 联想教育科技(北京)有限公司
本科 5-10年 Spring Python MySQL DM 软件/IT服务

YES工程师

1.5-3万·13薪 永芯科技(北京)有限公司
硕士 3-5年 Java Oracle 项目管理 半导体/芯片
最新招聘
热门城市
热门职位
热门公司