岗位要求:
1)8年以上大型软件平台/IT系统/网络系统运维经验,有独立负责复杂系统或平台模块运维的经验。
2)精通运维技术栈:对IaaS层(服务器、操作系统、容器、微服务),PaaS(数据库、中间件)、网络(TCP/IP、Web、负载均衡、网络安全)、软件(B/S三层架构、主流开发平台)相关领域均有所涉足,能判断数字化平台障碍,调度相关厂家解决。
3)深刻理解运维监控体系:包括运维分层监控工具和流程,devops等。
3)团队管理能力:管理过5人以上技术团队。
4)项目管理能力:以项目经理或技术经理角色,管理过大型软件项目的开发、交付、运维(三者包含其一即可),能清晰描述曾主导或深度参与过的至少一个中型以上运维项目(包括开发、迁移、升级、建设等)的背景、个人角色、挑战与成果。
5)沟通协调能力:出色的口头与书面沟通能力,有直接面向业务方或客户提供技术支持、进行技术汇报和协调资源的成功经验。具备强烈的服务意识和责任心。
6)加分项:有云、网、安相关证书。包括红帽RHCE/RHCA;PMP(项目管理专业人士认证);华为HCIP/HCIE;思科CCNP/CCIE;
岗位职责:
1)负责调度公司技术团队或第三方软件公司完成大型数字化平台(云上或混合云环境)的日常监控、巡检、故障应急响应与处理,保障系统SLA。
2)负责调度公司技术团队或第三方软件公司,完成数字化平台容量规划、性能调优、成本优化及稳定性建设,制定并执行容灾、备份与恢复策略。牵头处理突发的重大线上故障,进行根因分析,并推动实施永久性解决方案。
3)负责公司运维队伍建设。