招聘对象: 2026届应届硕士生,专业对口。应届生(计算机科学、人工智能、软件工程等相关专业)
【岗位职责】
1.负责编制、审核AI算力集群硬件设备配置方案,编制IT总体设计方案及部署实施方案;
2.负责算力硬件设备的上架、部署、测试、配置与故障检测;
3.负责算力集群的网络规划设计与实施,维护、优化集群的标准化配置基线;
4.负责算力集群ROCE、InfiniBand网络的配置、调优与性能监控,确保高带宽、低延迟通信性能;
5.负责国产化高性能硬件设备(如国产CPU、GPU、网络与存储设备等)的基础配置与测试验证;
6.参与AI算力资源池的构建与管理,支持AI模型训练、推理及高性能计算任务的资源调度;
【任职要求】
1.学历背景:计算机科学、人工智能、软件工程等相关专业, 2026届应届硕士生
2.熟悉服务器、网络及存储设备的安装、配置与维护,具备扎实的Linux系统运维能力;
3.熟悉GPU服务器体系结构,了解NVIDIA、华为昇腾、寒武纪等主流算力架构及GPU加速卡特性;
4.熟悉ROCE、InfiniBand网络与调优方法,掌握RDMA通信原理及网络性能监测工具;
5.熟悉CUDA、cuDNN、NCCL等AI计算框架底层组件,具备PyTorch、TensorFlow等深度学习框架运行环境配置经验;
6.熟悉国产化硬件与操作系统的基础配置与兼容性调优。