该职位已失效,看看其他机会吧

强化学习算法工程师

2.5-3.5万
  • 北京海淀区
  • 经验不限
  • 硕士
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 团队执行强
  • 人际关系好
  • 氛围活跃
  • 交通便利
  • 实力大公司
  • 五险一金

职位描述

PyTorchPythonC++强化学习运动控制DQNPPOTensorFlow人工智能
岗位职责:
1、负责设计和研发适用于多自由度机器人决策规划的强化学习算法(如DQN、PPO、SAC、多智能体RL等)的研究、设计与优化,解决复杂决策与控制问题,并在实际机器人上进行验证;
2、针对机器人控制场景,搭建仿真环境并设计RL训练框架;
3、结合深度强化学习(DRL)技术,实现算法在真实物理系统(如机械臂、无人机)中的部署与调优;
4、优化算法训练效率(如样本利用率、并行计算、分布式训练),提升模型收敛速度与稳定性;
5、将RL算法落地到实际产品中,解决动态环境下的实时决策问题;
6、编写高质量的算法代码和技术文档;
7、跟踪学术界与工业界前沿技术,推动算法创新;
8、参与项目需求分析、技术方案设计和算法性能优化
任职要求:
1、 硕士及以上学历,计算机科学、人工智能、自动化、控制科学与工程、应用数学、统计学等相关专业;
2、扎实的机器学习与强化学习理论基础,熟悉MDP、贝尔曼方程、策略梯度等核心概念;
3、 熟悉模糊控制、MPC、路径规划等算法;
4、精通至少一种主流深度学习框架(PyTorch/TensorFlow),具备DRL算法实现经验;
5、具备良好的英文文献阅读能力;
6、具备良好的沟通能力和团队合作精神
加分项:
1、了解机器人运动学/动力学建模,或有实际系统(如ROS)集成经验;
2、熟悉现代控制理论基础,如状态反馈控制、最优控制、自适应控制等;
3、熟悉分布式训练框架(Ray/RLLib、Horovod)及CUDA加速技术者优先;
4、熟悉主流RL库(Stable Baselines3、RLlib、Spinning Up);
5、熟悉AutoRL、课程学习(Curriculum Learning)等自动化训练技术;
6、熟悉ROS/ROS2机器人操作系统;
7、有系统控制仿真、PLC开发等相关项目经验;
8、在相关领域发表过高水平论文或拥有相关专利
查看全部

工作地点

北京海淀区智谷大厦

职位发布者

郭福盘/招聘经理

刚刚活跃
立即沟通
公司Logo浪潮集团公司标签
浪潮集团是中国领先的云计算、大数据服务商,拥有三家上市公司。主要业务涉及计算装备、软件、云计算服务、新一代通信、大数据及若干应用场景。作为中国最早的IT品牌之一,浪潮致力于成为世界一流的新一代信息技术龙头企业经济社会数字化转型的优秀服务商,新型基础设施建设的骨干企业。
公司主页