职位描述
ShellPythonGoLangPrometheusGrafana大数据集群运维自动化运维工具开发大数据平台架构优化
工作职责
1. 负责Hadoop、Spark、Flink等大数据集群的日常运维与性能调优,保障系统7×24小时稳定运行。
2. 开发自动化运维工具与监控平台,覆盖集群部署、故障自愈、资源调度等场景,降低人工运维成本。
3. 参与大数据平台架构优化,推动集群资源的高效利用与弹性伸缩能力建设。
4. 制定并执行数据备份与灾难恢复策略,确保数据安全与业务连续性。
任职要求
1. 本科及以上学历,计算机、软件工程等相关专业,3年以上大数据运维或开发经验。
2. 精通Linux系统管理,熟练掌握Shell/Python/Go等至少一门脚本语言,具备自动化工具开发能力。
3. 深入理解HDFS、YARN、Kafka等大数据组件的底层原理,能独立解决复杂集群故障。
4. 熟悉Prometheus、Grafana等监控工具,具备监控体系搭建与告警策略优化经验。
5. 具备较强的问题分析能力与抗压能力,能快速响应并解决生产环境突发事件。
1. 负责Hadoop、Spark、Flink等大数据集群的日常运维与性能调优,保障系统7×24小时稳定运行。
2. 开发自动化运维工具与监控平台,覆盖集群部署、故障自愈、资源调度等场景,降低人工运维成本。
3. 参与大数据平台架构优化,推动集群资源的高效利用与弹性伸缩能力建设。
4. 制定并执行数据备份与灾难恢复策略,确保数据安全与业务连续性。
任职要求
1. 本科及以上学历,计算机、软件工程等相关专业,3年以上大数据运维或开发经验。
2. 精通Linux系统管理,熟练掌握Shell/Python/Go等至少一门脚本语言,具备自动化工具开发能力。
3. 深入理解HDFS、YARN、Kafka等大数据组件的底层原理,能独立解决复杂集群故障。
4. 熟悉Prometheus、Grafana等监控工具,具备监控体系搭建与告警策略优化经验。
5. 具备较强的问题分析能力与抗压能力,能快速响应并解决生产环境突发事件。
工作地点
广州白云区黄边北路152号之一813室

认证资质
营业执照信息

更新于 2026-05-26 00:49:48





