更新于 今天

强化学习算法工程师

2-3.5万·16薪
  • 长沙望城区
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

人形机器人人工智能
1、开发、训练和部署用于运动和操作任务的强化学习算法;
2、构建模拟基础设施,支持大规模通用人形机器人运动和操纵策略的训练;
3、与控制团队合作,将策略集成到现有的控制堆栈中;
4、定义、测试和评估学习策略的性能指标等。
要求:
1、本科及以上学历,计算机、软件工程、自动化、电子信息、机械等相关专业;
2、熟练使用PyTorch编写生产质量代码;
3、熟悉在线和离线强化学习算法如PPO,SAC等;
4、熟悉常见的RL技术,例如:领域随机化、课程学习、奖励塑造等,具有调整这些RL算法的超参数和成本函数的经验;
5、熟悉通用ML评估工具,例如 TensorBoard、Weights&Biases等;拥有训练双足机器人运动策略经验者优先。

工作地点

长沙望城区中联重科智慧产业城1

入职公司信息

  • 入职公司: 中联重科股份有限公司
  • 公司地址: 长沙岳麓区银盆南路361号中联科技园中联重科股份有限公司
  • 公司人数: 10000人以上

认证资质

  • 人力资源服务许可认证

    人力资源服务许可证是由国家人力资源与社会保障相关部门颁发,代表人才经纪人所在企业可以合法开展人力资源相关业务的资质证件。展示该标签代表该企业发布此职位时已上传《人力资源服务许可证》或《人力资源服务备案证书》并经由平台审验通过。

职位发布者

张先生/人事经理

刚刚活跃
立即沟通
湖南乐孚信息技术有限公司
计算机技术开发、技术服务;计算机技术咨询;计算机技术转让;软件开发;软件技术服务;引进新技术、新品种,开展技术培训、技术交流和咨询服务;企业管理咨询服务;数据处理和存储服务;人才中介服务;广告设计;信息技术咨询服务;广告发布服务、制作服务、国内代理服务。
公司主页