核心职责
1.平台设计与构建:设计并实现企业级AI平台的整体架构,包括模型训练平台、推理服务平台、数据管理平台等,进行各种AI应用和模型的研发、训练、部署及管理。
2.资源与效能管理:规划和管理GPU等异构算力资源,设计资源调度策略,实现弹性伸缩与成本优化。
3.工程化与标准化:建立模型从开发、训练、评估到部署上线的标准化流水线(MLOps),提升AI研发与交付效率。
4.系统可靠与安全:设计高可用、高并发、多租户隔离的系统,保障平台稳定与数据安全。
任职要求
1.学历及工作年限要求
本科及以上学历,211/985毕业更佳,10年以上工作经验,且至少3年以上AI平台架构师经验。
2.硬技能要求
(1)编程与系统:精通Go/Java/Python等语言,深刻理解分布式系统、微服务、容器化技术(Docker/K8s)。
(2)AI与云平台:熟悉主流的机器学习框架(PyTorch/TensorFlow),了解大模型及AI工程化相关技术,并精通至少一家主流云平台(AWS/Azure/阿里云)。
(3)大数据与数据工程:具备数据管道(ETL)、数据湖/仓的设计和搭建经验。
3.软技能与经验
(1)通常要求5年及以上相关经验,具备出色的技术领导力、系统思维和跨团队协作能力。
(2)需要优秀的沟通能力,能将复杂的架构概念清晰地传达给不同背景的受众。