强化学习算法

3-5万·15薪

北京海淀区
1-3年
本科
全职
招1人

职位描述

强化学习人工智能

岗位职责
1、主导协作机械臂运动控制算法全流程开发，涵盖运动学正逆解优化（解析解 / 数值解结合）、动力学建模（拉格朗日法 + 惯性参数辨识）、轨迹规划（时间 - 能量优化多项式插值 / 动态避障算法）；
2、调试多模态遥操作架构，集成 ROS/ROS2 通信框架与实时数据采集模块，满足机械臂在远程操作场景下的厘米级位置同步精度与低控制延时需求；
3、协同完成机械臂 - 工具端 - 传感单元的硬件集成，负责多设备标定（手眼标定 / 工具坐标系校准）及系统级性能优化（振动抑制 / 轨迹平滑）；
4、参与工业级强化学习算法研发，针对非结构化环境操作设计状态空间建模（关节空间 + 任务空间融合）、奖励函数优化（力控误差 + 能耗加权）方案，利用 Isaac Sim/PyBullet/Gazebo 等仿真平台完成算法训练，推动 Sim2Real 迁移落地；
任职要求
1、机械工程、自动化、机器人学等相关专业本科及以上学历，硕士 / 博士在运动控制、机器人学方向有深入研究者优先；
2、完整主导过机械臂控制项目落地，涵盖算法设计、仿真验证、硬件部署全流程，具备处理奇异点规避、关节力矩饱和等工程问题的成熟方案；
3、扎实掌握 PID 控制（增量式 / 抗饱和设计）、阻抗控制（力位混合控制参数整定）、自适应控制等经典方法，具备机械臂动力学参数辨识（最小二乘法 / 递归最小二乘法）实战经验；
4、避障算法：具备路径规划算法（RRT 等）、碰撞检测算法（离散碰撞检测等）工程化经验；
5、掌握 PPO/SAC 等强化学习算法在机器人中的应用，熟悉仿真环境定制（动作空间离散化 / 奖励函数工程化设计）、样本高效训练（experience replay / 模仿学习初始化）及 Sim2Real 迁移技术（域随机化 / 对抗网络校准）；
6、了解 GAN/VAE/3DGS 等生成模型在机器人感知中的应用，如虚拟场景点云生成、光照变化鲁棒性训练；熟悉域适应技术（如 CycleGAN 风格迁移）在视觉定位算法跨环境部署中的实践；
7、对 Pick-and-Place、TCP 动态补偿、精密装配（孔轴对齐）等工业任务流程有深入理解，能结合工艺约束（如速度 - 加速度限制、工具负载特性）优化轨迹规划策略。

工作地点

北京海淀区西小口附近

认证资质

营业执照信息

完善一份简历
1736万+企业在线搜索，780万+海量职位精准推荐

相似职位

【快Star-X实习】多模态训推引擎研发工程师面议
北京 - 海淀
北京达佳互联信息技术有限公司
【快Star-X】多模态推理模型算法工程师面议
北京
北京达佳互联信息技术有限公司
算法工程师3.5-5万·13薪
北京 - 海淀
遨天科技(北京)有限公司
AI数字化技术经理2.5-5万
北京 - 朝阳
北京秀水街商业管理有限公司
【快Star-X实习】多模态大模型强化学习算法工程师-Keye面议
北京 - 海淀
北京达佳互联信息技术有限公司
AI算法工程师1.2-1.5万·16薪
北京 - 海淀
中国信息通信研究院

查看更多相似职位

职位发布者

陈晓玲/人事经理

今日活跃

立即沟通

丹阳合十智能科技有限公司

许可项目：第三类医疗器械经营；食品销售（依法须经批准的项目，经相关部门批准后方可开展经营活动，具体经营项目以审批结果为准）一般项目：人工智能通用应用系统；人工智能应用软件开发；软件开发；工业设计服务；专用设备制造（不含许可类专业设备制造）；电子专用设备制造；电子专用设备销售；第一类医疗器械销售；第二类医疗器械销售；信息咨询服务（不含许可类信息咨询服务）；养生保健服务（非医疗）；健康咨询服务（不含诊疗服务）（除依法须经批准的项目外，凭营业执照依法自主开展经营活动）

公司主页

关于我们: 公司介绍; 联系我们; 诚聘英才

产品与服务: 人才招聘; 企业招聘

使用与帮助: 账号注销; 意见反馈; 发票制度; 防骗指南; 法律协议; 资质公示

智联招聘更懂你的价值

智联app小程序官方微信企业版APP

京ICP备12025925号京ICP证010207号

京公网安备 11010502059392号人力资源许可证:1101051996081号

网上有害信息举报专区违法不良信息举报电话:400-885-9898 关爱未成年举报热线:400-885-9898-3

朝阳区人力资源与社会保障局监督电话

网络110报警服务电子营业执照