一、岗位职责
1.参与智能中台/数据飞轮平台后端系统研发,支撑数据集管理、模型训练、模型推理、模型评估的全流程闭环能力建设。
2.负责模型训练、推理、评估等任务的管理与调度能力后端实现,包括任务建模、状态流转、资源申请与运行监控。
3.参与数据集管理、模型管理、算力资源管理等核心平台能力建设,支撑模型全生命周期管理与持续迭代。
4.对接Kubernetes/容器化平台,参与算力资源调度、任务编排及运行状态管理,支撑大模型及行业模型的工程化运行。
5.与算法、数据、平台等团队密切协作,推进大模型与行业模型在业务场景中的落地与规模化应用。
二、任职要求
(一)基础条件
1.本科及以上学历,计算机、软件工程、自动化等相关专业,3–5 年后端开发经验,具备1年及以上智能调度系统/平台类系统开发经验。
2.具备良好的问题分析与解决能力,具备较强的沟通协作能力和自主学习能力,代码风格规范,熟悉 Git、Maven 等常用开发工具。
(二)核心技术能力
1.精通Java或Python至少一门后端语言,熟练掌握 Spring Boot/Spring Cloud/Spring AI 等主流框架,具备微服务架构开发经验。
2.熟悉算力调度与任务管理的基本原理,有AI平台/算法平台/MLOps平台后端开发经验者优先。
3.了解或参与过模型训练、模型推理服务、模型评估等相关场景,对模型生命周期管理有基本理解。
4.理解分布式系统设计原则,熟悉Docker容器技术,了解Kubernetes基本概念及使用方式,熟悉CI/CD流程者优先。
(三)加分项
1.有智算中心、AI 平台、算力调度云平台 开发经验,熟悉 GPU 调度、YARN 运维或资源管理机制者优先。
2.有任务调度、批处理系统、工作流系统(如 Airflow、Argo 等)相关经验。
3.有GPU/算力资源管理、资源配额、队列调度 等相关实践经验。