岗位职责说明书
一、职位基本信息
核心目标:
协助完成AI智能体训练相关的技术研发、实验落地与工具优化,积累强化学习及智能体开发实战经验
二、职位概述
作为AI智能体训练工程师实习生,你将加入上市公司浙大网新下属业务子公司浙江网新帮德信息服务有限公司,如:通用智能体研发/行业场景智能体落地]团队,在资深工程师指导下,参与智能体训练环境搭建、强化学习算法实现、实验评估等核心环节。本岗位注重实践能力培养,你将有机会接触工业级智能体开发流程,参与城市管理相关业务场景,如:道路病害分析智能体/对话式智能体,通过实战提升技术应用与问题解决能力。
三、核心职责
1. 训练环境与数据支持
² 协助构建、调试并维护强化学习训练环境,包括OpenAI Gym/MuJoCo/Unity ML-Agents/自研环境等的部署与适配;
² 参与训练数据的采集、清洗、标注与增强工作,搭建高效数据处理管道,保障训练数据质量;
2. 算法实现与模型训练
² 基于PyTorch/TensorFlow等深度学习框架,复现经典强化学习算法(PPO/SAC/DQN等)或适配团队自研算法;
² 在指导下参与智能体模型的训练调优,监控训练过程中的关键指标(损失曲线、奖励收敛情况等),记录调参日志;
² 协助完成分布式训练环境的搭建与适配,提升训练效率。
3. 实验评估与迭代
² 参与设计智能体性能评估方案,完成离线/在线测试与结果分析,量化智能体的成功率、鲁棒性、泛化能力等;
² 协助开发实验可视化工具、自动化评估脚本,提升实验效率与可复现性;
² 撰写实验报告,梳理问题并提出合理优化建议,配合团队完成模型迭代。
4. 技术支撑与调研
² 跟踪强化学习、智能体开发等领域的前沿技术与行业动态,完成指定方向的技术调研报告;
² 协助维护团队技术文档、代码仓库,参与内部工具链(如日志分析、行为回放工具)的开发与优化;
² 参与团队技术沟通会,同步工作进展,分享学习心得与技术思考。
四、任职要求
(一)基础要求
学历:本科/硕士在读,计算机科学与技术/人工智能/自动化/数学/统计等相关专业;
技能:精通Python编程,具备扎实的数据结构与算法基础,熟悉至少一种深度学习框架(PyTorch/TensorFlow);
知识:理解机器学习、深度学习核心原理,掌握强化学习基本概念(智能体、环境、奖励、策略等)与经典算法逻辑;
能力:具备良好的逻辑分析、问题定位能力,工作认真负责,有团队协作意识。
五、实习收获
1、获得资深工程师1对1指导,快速提升技术能力与工程思维;
2、实习补贴、转正机会等