一、岗位职责
1. 负责ES、Redis、Nginx、CLB/SLB等平台组件的搭建、维护、故障问题排查工作;
2. 负责上述平台组件的监控搭建和日常维护,保障集群和数据业务高可用;
3. 负责主导平台组件相关的系统架构设计、业务场景设计,针对系统当前存在的问题提出整改方案,提升系统健壮性;
4. 负责网关负载类组件及负载链路的搭建,负责负载转发链路的配置和维护工作;
5. 深入理解业务运维需求,与开发团队及业务团队紧密协作,确保技术方案与业务目标高度匹配,保障业务连续性。
二、任职说明
1. 学历与专业:硕士及以上学历,计算机科学与技术、软件工程、通信工程等相关专业,3年以上系统运维或平台运维等相关工作经验。
2. 技能要求:
(1)熟悉Linux操作系统的常见命令和运维技能,熟练使用shell、python等脚本工具进行自动化运维;
(2)熟练掌握常见平台组件,如ES、Redis、Nginx、CLB/SLB等组件的部署、配置与维护工作,熟练掌握上述相关组件的专业特性,熟悉上述组件典型常见的故障问题点;
(3)具备系统架构、业务场景的设计和优化能力,能针对上述平台组件的使用场景提出优化建议,并推动完成相关的整改优化,提升组件稳定性;
(4)了解主流监控工具(如Zabbix、Prometheus、Grafana等)的使用,能搭建监控告警体系,具备基础的监控指标设计能力;
(5)具备一定的网络知识,了解HTTP/TCP/UDP等常见协议,具备端到端排查网络连通性和故障的能力;
(6)具备良好的文档编制能力,能清晰、规范地撰写各类项目文档,绘制系统架构图等。
3. 素质要求:
(1)具备较强的问题解决能力与抗压能力,能快速响应项目突发问题,在规定时间内推进问题解决;
(2)具备良好的团队协作精神,能高效配合跨部门团队完成项目目标,有责任心与执行力;
(3)对日常平台组件的生产变更、版本变更等夜间操作的工作性质具有清晰的认识,能够适应夜间变更白天调休的工作节奏。
4、优先条件
(1)熟悉Docker、K8s、Mesos等技术栈和技术生态的优先;
(2)具有大型互联网IT系统维护工作经历的、对高并发高性能有一定经验的优先。