该职位已失效,看看其他机会吧

强化学习工程师(RL Engineer)

1-2万
  • 青岛市南区
  • 3-5年
  • 硕士
  • 全职
  • 招2人

职位描述

自然语言处理智能驾驶人工智能计算机软件
一、岗位职责:
1、研究并实现强化学习算法(DQN/PPO/SAC/A3C等)解决实际问题;
2、设计仿真环境(Gym/Unity/Mujoco等)和奖励函数,优化智能体策略;
3、结合深度学习(如Deep RL)提升智能决策能力;
4、探索多智能体强化学习(MARL)、模仿学习(Imitation Learning)等方向。
二、职位要求:
1、计算机、人工智能、数学、自动化等相关专业硕士及以上学历; 3年以上工作机经验。
2、编程能力:熟练Python,熟悉PyTorch/TensorFlow/JAX等框架;
3、算法基础:扎实的机器学习/深度学习/强化学习理论基础;
4、项目经验:
(1)模型方向:有CV/NLP/推荐系统等领域的模型训练和优化经验
RL方向:有机器人控制、游戏AI、自动驾驶等RL应用经验
(2)加分项(Nice-to-Have)
熟悉分布式训练(DDP/FSDP/Horovod)或大模型训练(LLM/RLHF)
有强化学习竞赛(如Kaggle、AI Dungeon)或论文发表(ICML/NeurIPS/ICLR)经验,熟悉CUDA优化、模型部署(TensorRT/Triton)或边缘计算(Jetson)。
三、福利待遇:
双休+六险一金+年终奖+部门奖金+节假日福利+生日福利+员工体检+员工旅游+电话补贴+交通补贴
查看全部

工作地点

青岛市南区远雄国际广场

职位发布者

韩女士/HR

昨日活跃
立即沟通
公司Logo青岛威瑞富泰能源有限公司
青岛威瑞富泰能源有限公司,座落于风景秀丽的沿海开放城市山东省青岛市,是一家专注于矿产能源、化工品贸易和供应链管理的专业化公司,主营业务涵盖煤炭、铁矿石、硫磺等大宗商品的进口分销以及国内加工和国内贸易。凭借在风险管理、衍生品对冲、供应链管理和市场营销方面的专业经验和优势资源,威瑞富泰与国内外诸多知名公司建立了长期良好的合作伙伴关系并一直致力于不断扩大优质客户群,为客户提供贴心的增值服务。目前,公司业务已经覆盖北美、澳大利亚、中东、日本、韩国、俄罗斯等。威瑞富泰始终遵循国际贸易惯例,坚守契约精神、共赢发展。公司以敏锐的市场嗅觉,及时调整经营策略,形成了以企业文化为依托,全员服务于客户的经营理念。稳健发展,运营规范、团结协作,威瑞富泰优质的服务赢得了业界同仁的良好口碑。青岛威瑞富泰能源有限公司愿与国内外各界朋友竭诚合作,秉承创新服务精神,以全球化和信息化为契机,共创美好未来!
公司主页