「长沙开福区强化学习算法工程师招聘」_2026年北京华戍防务技术有限公司招聘-智联招聘

400-885-9898

更新于今天

APP

强化学习算法工程师

1.5-2.3万

长沙开福区
3-5年
本科
全职
招1人

职位描述

强化学习 PPOPyTorchPython

岗位职责描述：
1、负责基于 Python 的人工智能算法与模型开发，重点涉及强化学习算法的实现、调试和优化，确保算法满足业务场景的性能要求。
2、参与强化学习系统架构设计与搭建，制定技术方案和开发规范，指导团队成员进行模块开发，保证系统的整体质量。
3、承担规则智能体的设计与开发工作，根据业务规则和逻辑，构建高效、准确的规则智能体，实现智能决策功能。
4、探索大模型在强化学习领域的应用，将大模型与强化学习技术相结合，提升系统的智能化水平和处理复杂问题的能力。
5、利用仿真平台进行智能体的训练、测试和验证，搭建仿真环境，设计测试用例，评估智能体的性能，不断迭代优化模型。
6、撰写相关的技术文档，包括算法设计文档、开发手册、测试报告等，确保技术成果的可追溯性和可复用性。
任职要求：
1、精通 Python 编程语言，熟练运用常用数据处理及深度学习框架，具备良好的代码规范和开发习惯
2、深入理解强化学习核心算法（如 PPO、A2C 等），熟悉强化学习的理论基础与数学原理，能够独立设计、实现和优化强化学习模型。
3、具备强化学习系统架构设计经验，能够根据业务需求规划系统整体架构，掌握规则智能体的设计与开发方法，能够将业务规则转化为可执行的智能体逻辑
相关工作经验：
1、能够快速理解业务需求，并将其转化为具体的人工智能技术方案，制定合理的开发计划和时间节点。
2、具备较强的问题解决能力，在模型训练、系统开发过程中能够及时发现并解决出现的技术难题，确保项目顺利推进。
3、拥有良好的团队协作精神，能与产品、测试等相关部门紧密配合，共同完成项目目标。
4、保持对人工智能领域新技术、新算法的敏感度和学习热情。

工作地点

长沙开福区湘域智慧-南栋1005号

完善一份简历
1736万+企业在线搜索，780万+海量职位精准推荐

相似职位

算法工程师7000-14000元
长沙 - 开福
中国人民解放军国防科技大学智能科学学院
感知算法工程师2-3.5万·13薪
长沙 - 长沙
湖南五新隧道智能装备股份有限公司
仿真建模算法工程师1.5-2.5万·13薪
长沙 - 开福
北京方州科技有限公司
大模型Agent算法工程师2-3万
长沙 - 岳麓
中联重科
算法工程师1.1-2万·14薪
长沙 - 岳麓
中腾晟维科技(湖南)有限公司
地球物理工程师-算法（JSB）1-2万
长沙 - 岳麓
继善高科

查看更多相似职位

职位发布者

穆女士/人事专员

昨日活跃

立即沟通

北京华戍防务技术有限公司

北京华戍防务技术有限公司成立于2011年3月，是一家专门从事联合作战推演及军事人工智能的国家高新技术企业同时是中关村高级技术企业，公司座落于北京市海淀区上地马连洼北路万霖科技大厦。公司具有相关军工资质，并于2015年10月通过了ISO9001：2008质量管理体系认证，2016年9月取得《中关村高新技术企业》，2016年12月取得《国家高新技术企业》。公司目前具有软件著作权11项。公司研制了“墨子联合作战推演系统”、“墨子军事人工智能平台”等软件产品，在军队及军工单位得到了广泛应用。

公司主页

关于我们: 公司介绍; 联系我们; 诚聘英才

产品与服务: 人才招聘; 企业招聘

使用与帮助: 账号注销; 意见反馈; 发票制度; 防骗指南; 法律协议; 资质公示

智联招聘更懂你的价值

智联app小程序官方微信企业版APP

京ICP备17067871号合字B2-20210134

京公网安备 11010502030147号人力资源许可证:1101052003273号

网上有害信息举报专区违法不良信息举报电话:400-885-9898 关爱未成年举报热线:400-885-9898-7

朝阳区人力资源与社会保障局监督电话

网络110报警服务电子营业执照