更新于 2025-12-25 00:31:21

强化学习算法工程师

1.2-2万
  • 青岛市南区
  • 1-3年
  • 硕士
  • 全职
  • 招3人

职位描述

强化学习 多模态算法大模型算法搜索/推荐算法自然语言处理PyTorchPython量化交易人工智能证券/期货投资/融资
一、岗位职责:
1、利用强化学习方法构建可交易策略,包括状态设计、奖励函数、训练与回测。
2、搭建或改进市场模拟环境,提高策略在真实市场中的稳定性。
3、引入并实现主流 RL 算法(如 PPO、SAC、DQN 等),不断优化策略表现。
4、与量化研究员合作,将 RL 模型与市场特征、传统因子或交易执行流程结合。
5、跟踪强化学习与序列决策领域的新技术,并探索在交易中的应用。
二、任职要求:
1、计算机、人工智能、数学、统计、自动化等相关专业硕士及以上学历。
2、熟悉强化学习基础概念(MDP、策略梯度、值函数等),有相关项目经验。
3、熟练使用 Python 和 PyTorch,具备良好的工程实现能力。
4、有真实场景(如游戏、推荐、控制、交易)中训练 RL 模型的经历优先。
5、具备良好的逻辑能力、自驱力和数据分析能力。
三、加分项:
1、有量化策略研究、回测框架或市场微结构相关经验
2、对 RL 开源框架有实践经验(如 Stable Baselines3、RLlib 等)
3、有论文、比赛、开源项目等可展示成果
四、福利待遇:
双休+提供住宿+六险一金+股权激励+年终奖+部门奖金+节假日福利+生日福利+员工体检+员工旅游+电话补贴+交通补贴

工作地点

青岛市南区远雄国际广场

职位发布者

韩女士/HR

昨日活跃
立即沟通
公司Logo青岛威瑞富泰能源有限公司
青岛威瑞富泰能源有限公司,座落于风景秀丽的沿海开放城市山东省青岛市,是一家专注于矿产能源、化工品贸易和供应链管理的专业化公司,主营业务涵盖煤炭、铁矿石、硫磺等大宗商品的进口分销以及国内加工和国内贸易。凭借在风险管理、衍生品对冲、供应链管理和市场营销方面的专业经验和优势资源,威瑞富泰与国内外诸多知名公司建立了长期良好的合作伙伴关系并一直致力于不断扩大优质客户群,为客户提供贴心的增值服务。目前,公司业务已经覆盖北美、澳大利亚、中东、日本、韩国、俄罗斯等。威瑞富泰始终遵循国际贸易惯例,坚守契约精神、共赢发展。公司以敏锐的市场嗅觉,及时调整经营策略,形成了以企业文化为依托,全员服务于客户的经营理念。稳健发展,运营规范、团结协作,威瑞富泰优质的服务赢得了业界同仁的良好口碑。青岛威瑞富泰能源有限公司愿与国内外各界朋友竭诚合作,秉承创新服务精神,以全球化和信息化为契机,共创美好未来!
公司主页