【岗位职责】
1.负责智能制造业务系统日常巡检与监控,通过主动预防性维护确保SLA达标。精通Linux系统性能调优(CPU/内存/IO)及故障处理,负责服务器资源规划与底层基础设施稳定运行。熟悉Docker/K8s容器化平台架构,理解k8s核心组件原理,保障业务高并发下的弹性伸缩与高可用。
2.作为线上稳定性第一防线,快速响应定位系统异常(硬件故障/系统异常/应用卡顿),具备全链路排查能力,最大限度缩短故障恢复时间。重点要求具备JVM内存分析能力,熟练运用MAT/Arthas等工具分析内存溢出、频繁GC问题,协助开发定位代码级性能瓶颈。
3.负责服务器漏洞修复加固,对中间件层(Nginx/Tomcat/Redis)及容器镜像层进行安全风险评估,制定补丁修复或升级方案,确保满足安全合规要求。定期进行系统风险治理,识别单点故障/资源瓶颈等潜在风险并推动防范措施落地。
4.负责自动化运维工作。定期分析运维数据,为容量规划和架构优化提供决策支撑。
5.编写维护SOP文档、故障复盘报告,促进经验沉淀。完成领导交办的其他任务。
【任职要求】
1.计算机或相关专业,本科及以上学历,五年以上运维开发经验;
2.Linux操作系统:深入理解系统原理,具备扎实调优经验,能独立排查CPU飙升、内存泄漏、IO夯死等疑难问题。
3.容器化与编排:精通Docker(镜像构建/瘦身/安全扫描),精通Kubernetes架构原理,有生产环境K8s集群运维经验。
4.对智能运维、RPA自动化,可观测(ebpf),CMDB等有所了解,或者有使用经验。要求至少有Python脚本开发经验。
5.有JVM调优经验:具备JVM内存分析能力,有实际Full GC排查案例者优先。
6. 信创项目经验:熟悉麒麟系统、鲲鹏架构、达梦/金仓数据库适配者优先。
7. 安全加固经验:熟悉漏洞修复流程,熟练使用Trivy/Nessus等工具,有实际漏洞修复案例者优先。
8. 极强责任心与敬畏心:严谨对待每一次变更,能承受高压工作环境。
9. 文档与沟通能力:具备优秀文档协作能力,善于与开发团队(特别是Java开发)高效协同,共同优化系统架构。
10. 具良好的沟通能力和团队协作精神
11. 有云计算平台运维经验者优先
12. 持有相关专业认证者优先,如CCNA、CCNP、RHCE等