岗位职责:
1、负责运维平台的部署,提升运维质量及效率,达成运维自动化平台、日志平台、缓存平台持续迭代建设;
2、负责监控告警系统的设计和开发,做到监控可视化、故障自动化,7x24小时响应故障处理,对平台的运维质量负责;
3、评估系统性能和运行状态,建立量化指标,用数据指导优化,技术文档的整理和编写;
4、安全规划和管理,不限于网络、系统、数据、操作等安全,组织定期或者不定期进行安全演练;
5、负责运维和测试的建设,维护等日常运维工作,负责项目部署后调优及配合开发人员解决问题;
任职要求:
1、熟练掌握Linux操作系统,熟悉shell语言,熟悉自动化运维,擅长ansible/zabbix其中至少一项工具;
2、熟练掌握tomcat、nginx、php、msyql、lvs、 jenkins、redis、等软件,熟练掌握自动化集成部署方案;
3、熟练掌握大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;
4、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况,熟悉主备、主从、安全机制;
5、熟悉hadoop、Spark、Zookeeper等组件的原理及运维方式,有docker、kubernetes生产实践经验者优先;
6、具备快速故障排错的能力,具备一定的大型应用系统的架构优化能力,优秀的全局观,对虚拟化、服务器硬件、操作系统、网络、存储、应用中间件的工作原理等方面的技术有深入的理解和经验;
职位福利:五险一金、周末双休、绩效奖金、带薪年假、补充医疗保险、节日福利、定期团建、餐补