更新于 今天

强化学习算法工程师

1.5-2.3万
  • 长沙开福区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

强化学习 PPOPyTorchPython
岗位职责描述:
1、负责基于 Python 的人工智能算法与模型开发,重点涉及强化学习算法的实现、调试和优化,确保算法满足业务场景的性能要求。
2、参与强化学习系统架构设计与搭建,制定技术方案和开发规范,指导团队成员进行模块开发,保证系统的整体质量。
3、承担规则智能体的设计与开发工作,根据业务规则和逻辑,构建高效、准确的规则智能体,实现智能决策功能。
4、探索大模型在强化学习领域的应用,将大模型与强化学习技术相结合,提升系统的智能化水平和处理复杂问题的能力。
5、利用仿真平台进行智能体的训练、测试和验证,搭建仿真环境,设计测试用例,评估智能体的性能,不断迭代优化模型。
6、撰写相关的技术文档,包括算法设计文档、开发手册、测试报告等,确保技术成果的可追溯性和可复用性。
任职要求:
1、精通 Python 编程语言,熟练运用 常用数据处理及深度学习框架,具备良好的代码规范和开发习惯
2、深入理解强化学习核心算法(如 PPO、A2C 等),熟悉强化学习的理论基础与数学原理,能够独立设计、实现和优化强化学习模型。
3、具备强化学习系统架构设计经验,能够根据业务需求规划系统整体架构,掌握规则智能体的设计与开发方法,能够将业务规则转化为可执行的智能体逻辑
相关工作经验:
1、能够快速理解业务需求,并将其转化为具体的人工智能技术方案,制定合理的开发计划和时间节点。
2、具备较强的问题解决能力,在模型训练、系统开发过程中能够及时发现并解决出现的技术难题,确保项目顺利推进。
3、拥有良好的团队协作精神,能与产品、测试等相关部门紧密配合,共同完成项目目标。
4、保持对人工智能领域新技术、新算法的敏感度和学习热情。

工作地点

长沙开福区湘域智慧-南栋1005号

职位发布者

穆女士/人事专员

昨日活跃
立即沟通
公司Logo北京华戍防务技术有限公司
北京华戍防务技术有限公司成立于2011年3月,是一家专门从事联合作战推演及军事人工智能的国家高新技术企业同时是中关村高级技术企业,公司座落于北京市海淀区上地马连洼北路万霖科技大厦。公司具有相关军工资质,并于2015年10月通过了ISO9001:2008质量管理体系认证,2016年9月取得《中关村高新技术企业》,2016年12月取得《国家高新技术企业》。公司目前具有软件著作权11项。公司研制了“墨子联合作战推演系统”、“墨子军事人工智能平台”等软件产品,在军队及军工单位得到了广泛应用。
公司主页