岗位描述:
1、参与基础架构资源(包括云和非云环境的系统、网络、存储等资源)的统筹规划和管控,提供稳定高效持续的资源交付能力,提高整体运维效率,降低成本;
2、参与基础架构平台及系统的高可用体系建设,如故障自动定位、故障演练、应急预案的建设,自动恢复、自适应容灾等,保障业务持续可用;
3、参与基础架构规划和设计,推动或主导关键技术演进,提升资源的弹性、可扩展和质量;
4、参与基础架构及各业务线的全链路压测,确保无单点,确保各组件的性能和可靠性;
5、参与各种集中存储和分布式存储系统的建设、监控、服务请求处理、变更上线、故障处理、升级优化、性能与容量管理、自动化交付、制度规范更新等日常工作;
6、参与基础架构自动化运维平台个组件的设计和开发。
7、负责数据中心日常运维巡检、上下架、设备验收和监控等工作;
8、负责数据中心资产管理、外部维护单位的管理与监督、项目实施和设备运行故障的处理等;
任职资格:
1、本科及以上,5年以上工作经验,有丰富的系统故障排查和解决经验和分析和解决问题的能力,大型互联网公司或者大型IT企业应用运维经验者优先;
2、熟悉Python、Shell或Go,熟练编写各种日常工具;
3、精通Linux操作系统,熟悉TCP/HTTP协议,熟悉性能调优,熟悉使用相关压测,监控等工具;
4、熟悉多种开源组件:Ansible、Nginx、LVS、Jenkins、Git、Redis、Mysql/SQL等;
5、精通各种集中存储和分布式存储如ceph的工作原理和存储机制,有ceph大规模集群部署、运维有故障处理能力;
6、了解PaaS平台建设者或熟悉运维自动化体系建设;
7、较顺畅合乎逻辑的沟通表达以及团队协作能力,有一定英文能力;
8、持有RHCA证书者优先。