强化学习算法工程师

2.5-3.5万

北京海淀区
经验不限
硕士
全职
招1人

查看更多相似职位

雇员点评标签

工作环境好
同事很nice
团队执行强
人际关系好
氛围活跃
交通便利
实力大公司
五险一金

职位描述

PyTorchPythonC++强化学习运动控制DQNPPOTensorFlow人工智能

岗位职责:
1、负责设计和研发适用于多自由度机器人决策规划的强化学习算法（如DQN、PPO、SAC、多智能体RL等）的研究、设计与优化，解决复杂决策与控制问题，并在实际机器人上进行验证；
2、针对机器人控制场景，搭建仿真环境并设计RL训练框架；
3、结合深度强化学习（DRL）技术，实现算法在真实物理系统（如机械臂、无人机）中的部署与调优；
4、优化算法训练效率（如样本利用率、并行计算、分布式训练），提升模型收敛速度与稳定性；
5、将RL算法落地到实际产品中，解决动态环境下的实时决策问题；
6、编写高质量的算法代码和技术文档；
7、跟踪学术界与工业界前沿技术，推动算法创新；
8、参与项目需求分析、技术方案设计和算法性能优化
任职要求:
1、硕士及以上学历，计算机科学、人工智能、自动化、控制科学与工程、应用数学、统计学等相关专业；
2、扎实的机器学习与强化学习理论基础，熟悉MDP、贝尔曼方程、策略梯度等核心概念；
3、熟悉模糊控制、MPC、路径规划等算法；
4、精通至少一种主流深度学习框架（PyTorch/TensorFlow），具备DRL算法实现经验；
5、具备良好的英文文献阅读能力；
6、具备良好的沟通能力和团队合作精神
加分项:
1、了解机器人运动学/动力学建模，或有实际系统（如ROS）集成经验；
2、熟悉现代控制理论基础，如状态反馈控制、最优控制、自适应控制等；
3、熟悉分布式训练框架（Ray/RLLib、Horovod）及CUDA加速技术者优先；
4、熟悉主流RL库（Stable Baselines3、RLlib、Spinning Up）；
5、熟悉AutoRL、课程学习（Curriculum Learning）等自动化训练技术；
6、熟悉ROS/ROS2机器人操作系统；
7、有系统控制仿真、PLC开发等相关项目经验；
8、在相关领域发表过高水平论文或拥有相关专利

查看全部