岗位职责:
1、负责系统、网络和存储资源的配置、监控、维护和故障排除参与节假日值守。
2、监控系统的性能与可用性,并依据监控结果对系统配置进行优化。
3、实施系统备份,制定并定期更新灾难恢复预案,以确保数据的安全性。
4、协助部署与更新系统及应用程序,涵盖自动化脚本的编写。
5、提供技术支持,解决用户的问题和系统故障。
6、编写和维护技术文档和操作手册。
7、与开发团队和实施团队紧密协作,推进关键问题的解决,确保业务的快速迭代和稳定运行。
8、配合客户管理要求,完成日常账号、安全、资源审计工作。
岗位要求:
1、精通Linux/Unix系统管理,能够编写自动化脚本,熟悉至少一种脚本语言(如Shell、Python)。
2、精通 Kubernetes (k8s) 和 Docker 相关技术,能够熟练进行配置及问题排查处理。
3、精通监控与告警工具,如Prometheus、Nagios和Zabbix,可以实现系统性能的自动化监控,确保故障得到及时响应并触发相应的告警。
4、熟悉国产化数据库,例如移动的PanweiDB、华为的GaussDB以及阿里云的PolarDB,需要具备出色的问题解决和性能优化能力。
5、精通国产操作系统,如中标麒麟、银河麒麟、统信UOS、BC-Linux等,能够针对各种系统环境执行高效的性能优化和故障排查。
6、精通安全防护工具的运用,能够有效地部署安全措施,并且具有强烈的遵守安全规范的意识。
7、具备在云平台上进行操作、配置及优化的能力。
8、具备出色的沟通技巧和团队协作精神,能在高压环境下保持镇定,准确地分析和解决问题。
9、有中国移动项目运维经验优先。
10、持有相关认证,如RHCE、CCNA、CKA、ITIL Foundation。