更新于 1月22日

深度强化学习算法工程师

2.5-4万
  • 北京昌平区
  • 1-3年
  • 硕士
  • 全职
  • 招1人

职位描述

运动控制人工智能电子/半导体/集成电路
岗位职责
1. 负责四/六足(含两前端机械臂参与支撑)自适应运动控制方案的总体设计与落地,覆盖行走/奔跑、转向/侧移、 多种跳跃、起伏路面与台阶上下等工况。
2. 负责基于强化学习的控制策略开发:观测量与动作空间定义、训练流程设计(奖励、课程学习、域随机化)、评估体系建立与迭代优化。
3. 负责仿真到实机(Sim2Real)迁移与调试:与嵌入式团队对齐控制频率、时延、限幅/限流/温升等安全约束,完成实机验证与问题闭环。
4. 负责部署工程化:模型轻量化、推理稳定性、异常检测与安全降级/回退策略,形成可量产的软件交付物与回归测试标准。
任职需求
1. 具备机器人强化学习落地经验,熟悉PPO/SAC等至少一种主流算法,并能独立完成训练、评估与迭代。
2. 具备多足/足式运动控制基础与工程经验,理解接触、摩擦、稳定性与恢复策略等关键问题。
3. 具备工程化与可交付意识,能够在硬件约束条件下实现稳定运行与可维护迭代。
4. 熟练使用Python,具备C++协作开发能力者优先。
加分项
- 熟悉MuJoCo/Isaac Gym/PhysX等仿真平台;具备嵌入式推理/量化部署经验(ONNX/RKNN等)。
- 有消费级机器人/玩具量产落地经验(成本、功耗、可靠性约束)。

工作地点

北京市-昌平区-双营西路82号院2号楼

职位发布者

孙女士/招聘主管

三日内活跃
立即沟通
公司Logo北京金钢科技有限公司
北京金钢科技有限公司(KingKong.tech)提供磁环编码器于各个行业领域,我们是专注于机器人相关产品研发的科技公司,以专业团队为支撑,拥有自研核心技术,为您带来更佳的机器人编码器方案,另外公司已取得高新技术企业证书。磁环编码器采用电磁技术来测量精密物理位移,如角度、距离、速度等,拥有更优秀的抗环境干扰能力,如防水、振动、污染、灰尘、高温等,是应用于数控制造、航空航天、机器人、工业流水线等领域的优选方案。我们主要为各种应用提供产品定制,如结构、数据类型、尺寸大小、精度、分辨率等参数,且拥有极薄的体积。以最佳的方案配合您的产品,用创新的核心技术解决行业问题,促进行业发展。
公司主页