任职资格:
1.计算机相关专业本科及以上学历,至少有5年主流云平台的建设、运维相关经验。
2.精通Linux操作系统和常用组件(Nginx,Tomcat,Elasticsearch,Redis,Kafka等)的部署优化,以及故障定位和处理。
3.精通一种以上编程语言,至少掌握python/java/go中的一种编程语言,能自主开发自动化运维平台或工具,提高运维效率。
4.熟悉Docker、Mesos、DC/OS、Kubernetes等主流容器技术的功能及原理,有大规模集群运维经验。
5.熟悉Ansible、SaltStack、Prometheus、Grafana、Zabbix、Pinpoint、Skywalking等开源运维工具。
6.了解HADOOP集群、PAAS组件,了解SPARK、HIVE、HBASE等技术,掌握SQL基本操作,具备编写存储过程的运营研发能力。
7.具备良好的服务意识、具备吃苦耐劳精神,能站在分公司一线角度分析、支撑问题。
8.具备运维团队牵头或项目管理经验,能够有效组织协调开发、测试、基础设施等多团队资源,推动运维相关项目(如自动化平台建设、架构优化、故障复盘改进、流程标准化等)的规划、实施与落地。
9.有主导运维自动化项目、或制定/优化运维规范(如SOP、应急预案、容量规划流程)的成功经验,具备技术方案选型及实施决策能力。
10.具备通信运营商行业相关的大数据应用系统开发、运维工作经验者优先。
岗位职责:
1.负责大数据项目管理,负责基于主流公有云产品的业务系统的规划、建设、维护与优化,确保业务系统的稳定性、高可用性和可扩展性。
2.负责大数据应用系统核心架构的性能调优,定位并修复系统的疑难问题,负责按运维需求完成自动化脚本的开发。
3.掌握云产品运维过程,针对应用系统资源需求、场景、部署、应用、优化、安全等进行实施支撑。
4.负责大数据应用系统日常运维,包括日/月数据维护作业处理、系统安全、系统监控和巡检、牵头处理复杂故障和预案优化等;
5.负责大数据应用系统新功能测试、上线割接和验证,保障系统升级全过程的稳定性;
6.负责大数据应用系统日常问题支撑,包括问题核查、全过程管控和支撑回复,提升业务人员使用系统的感知和满意度。
7.负责推动运维工作朝着自动化、智能化的方向演进,负责相关技术方案选型、项目规划与实施落地,提升整体运维管理效率。
8.负责组织或主导重大故障的复盘分析,推动制定并落实有效的改进措施,优化运维流程与规范。
9.协调开发、测试、基础设施、安全等团队资源,推动解决跨领域的复杂运维问题,确保运维需求在项目全生命周期中得到有效落实。