更新于 12月19日

强化学习算法工程师

2-4万
  • 北京海淀区
  • 3-5年
  • 硕士
  • 全职
  • 招1人

职位描述

自然语言处理机器视觉智能驾驶PyTorchTensorFlowPython强化学习人工智能云计算/大数据
【岗位职责】:
1、负责强化学习算法的研究、开发和应用,解决实际问题并提升业务效果;
2、设计和实现强化学习模型,包括但不限于价值迭代、策略梯度、模型预测控制等算法;
3、对现有强化学习算法进行优化和改进,提高算法的稳定性和收敛速度;
4、与数据工程师和产品团队合作,将强化学习算法集成到产品和服务中;
5、跟踪强化学习领域的最新研究进展,不断探索和创新,推动公司技术发展;
6、参与撰写技术文档,为团队提供算法知识和技能培训;
7、参与项目的需求分析、方案设计和技术评审。
【任职要求】:
1、计算机科学、人工智能、数学或相关专业硕士及以上学历,有3年以上强化学习算法开发经验;
2、熟悉强化学习的基本理论和算法,如Q-Learning、SARSA、Deep Q-Network (DQN)、Policy Gradient等;
3、具备扎实的数学基础,包括概率论、统计学、线性代数等;
4、熟练掌握至少一种编程语言,如Python,并熟悉TensorFlow、PyTorch等深度学习框架;
5、具备良好的科研能力,有在相关领域发表过论文者优先;
6、具备良好的逻辑思维能力和问题解决能力,能够独立分析和解决复杂问题;
7、有实际应用强化学习算法解决复杂问题的经验,如游戏、机器人控制、自动驾驶等;
8、具备良好的团队合作精神和沟通能力,能够与不同部门有效协作;
9、对技术创新有热情,愿意不断学习新知识,适应快速变化的技术环境。

【公司亮点】:
国企背书、发展稳定、五险一金、月度补贴、企业年金、法定假期、项目奖金、年终奖金

工作地点

北京海淀区清华同方科技大厦A座(南门)

职位发布者

潘靖雯/HRM

昨日活跃
立即沟通
公司Logo北京清创智科科技有限公司
同方股份有限公司成立于1997年6月,由清华大学出资成立的高科技上市企业。2019年12月,同方股份控股股东由清华控股变更为中国核工业集团,成为中核集团控股企业。北京清创智科科技有限公司(原北京同方智科科技有限公司)成立于2005年,隶属于同方股份科工产业本部,同方军工产业的骨干企业之一,中核下属的军工企业,是清华大学与同方整体技术力量资源对军队服务的窗口。公司具备完善的军工资质,具有人工智能模型和大模型应用开发工具和智能仿真推演工具,常年从事军工人工智能业务,为多家单位提供人工智能开发平台智能仿真平台和指挥决策类,装备类,训练类智能模型和智能体,应用在情报处理,作战筹划,仿真推演,作战评估等多个环节。公司战略定位:“专业的AI学习平台+领先的军事决策智能”公司主营业务:基于自身技术积累,依托清华大学的科研实力与人才平台,建立以人工智能强化学习平台、模拟仿真、大模型微调管理工具集为产品,军事智能应用为核心方向的业务发展体系。公司技术方向:基于深度学习、强化学习、大模型、并行计算等相关技术,自主研发军工级智能体开发平台,推动大模型从“生成式AI”到“生产力”,提供大模型落地应用底层技术,推动大模型完成落地最后一公里,完成可信自主智能体生成替代传统AI应用方式,致力于帮助客户构建私有、安全、可信的AI系统。
公司主页