职位描述
1、提供5×8小时的现场实施技术响应,提供工作时间外4小时内到场的现场支持服务。
2、负责服务器硬件故障排查与维修,包括硬件故障交叉技术定位,硬件更换,现场运维培训等。
3、负责GPU服务器底层硬件的故障排查与维修,涵盖NVLink连接、PCIe链路问题、GPU卡点不亮、显存报错、功耗异常等疑难杂症,并能精准定位故障部件(板卡、背板、线缆)。
4、负责NVIDIA GPU服务器的驱动安装、内核升级、固件刷新(FW Upgrade),解决驱动冲突、Kernel Panic、CUDA版本不兼容等系统级问题。
5、作为客户现场技术对接窗口,及时响应客户需求;整理并更新维护记录、应急预案及故障处理报告等。
二、任职要求:
大专及以上学历,计算机、电子信息、自动化等相关专业。
2年以上数据中心运维经验,有GPU服务器运维经验优先。
精通服务器硬件架构,能够独立完成GPU服务器故障排查与部件更换;熟悉SMC等主流GPU服务器品牌的硬件故障诊断;
理解Linux操作系统(CentOS/Ubuntu),熟练使用各类测试工具(FLD/GPU-BURN/DCGM)。
具备GPU服务器故障排查思路和文档撰写能力,能够独立承担驻场项目的技术对接工作;有团队管理经验或带教经验者优先。
工作地点

公司信息
公司介绍
北京华创方舟科技集团有限公司是一家国家高新技术企业,专业的智能化云综合服务提供商。公司成立于2006年,总部位于北京,全国设立7个大区,21个分支机构,形成了覆盖全国的业务营销网络和服务支持体系。华创方舟服务着全国数百家客户,其中已涉及税务、人社、金融、电力、制造等众多行业,公司的客户数、服务收入、净利润等经营指标逐年稳步上升,销售额连年过亿。华创方舟作为一家国家级高新技术企业,成立了华创研究院(北京),并设立了两处研发基地(北京、济南),拥有优秀的技术开发和应用专家,拥有诸多的自主知识产权的产品和行业解决方案。公司目前有六条产品线:1、 咨询服务包括IT治理与内控管控咨询服务、IT服务与运维管理咨询服务、上云咨询与云化评估服务、业务连续性与容灾咨询服务、信息安全评估与实施咨询服务。2、 解决方案包括业务连续性与容灾解决方案、一体化智能运管平台、大数据分析解决方案、数据交换平台。3、 系统集成包括信息系统集成实施服务、网络及安全系统集成实施服务、迁移服务(上云服务)。4、 维保支持包括软件支持服务、硬件支持服务、机房环境支持服务、评估与优化服务。5、 运营管理包括桌面运营服务、数据中心运营服务、云运营服务、安全运营服务。6、 软件开发包括软件系统设计与开发服务、应用开发和维护服务。公司资质与荣誉:ISO20000 IT服务管理体系认证证书ISO27001信息安全管理体系认证证书ISO9001质量管理体系认证证书ITSS信息技术服务运行维护标准符合性证书二级企业信息系统集成及服务资质二级企业国家信息安全测评信息安全服务资质证书(安全工程类一级)企业CMMI三级企业国家高新技术企业中关村高新技术企业中关村信用评级A级企业信息技术服务 服务管理 第1部分:通用要求 标准起草单位之一

更新于 2026-05-08 00:19:01




