职位描述
Linux网络协议DockerKubernetesAI训练平台运维服务器集群管理运维自动化脚本开发
工作职责
1. 负责公司服务器集群、网络设备及AI训练平台的日常运维与监控,保障系统7×24小时稳定运行。
2. 制定并执行系统备份策略,定期进行安全漏洞扫描与补丁更新,防范网络攻击与数据泄露风险。
3. 快速响应并解决系统故障,优化服务器性能,支撑AI模型训练、数据处理等核心业务场景的资源需求。
4. 编写运维自动化脚本,提升日常操作效率,降低人工干预成本。
1. 负责公司服务器集群、网络设备及AI训练平台的日常运维与监控,保障系统7×24小时稳定运行。
2. 制定并执行系统备份策略,定期进行安全漏洞扫描与补丁更新,防范网络攻击与数据泄露风险。
3. 快速响应并解决系统故障,优化服务器性能,支撑AI模型训练、数据处理等核心业务场景的资源需求。
4. 编写运维自动化脚本,提升日常操作效率,降低人工干预成本。
工作地点
上海徐汇区百汇园全江景写字楼

认证资质
营业执照信息

更新于 今天







