职位描述
PythonShell大数据集群运维自动化运维平台建设分布式故障排查服务器运维云运维IDC/机房运维KubernetesDockerKafkaC信息安全人工智能电力/水利/热力/燃气
工作职责
1. 负责Hadoop生态集群(HDFS、YARN、MapReduce、Hive、Spark等)的日常运维、监控与性能优化,保障集群高可用与稳定性。
2. 主导集群扩容、版本升级与配置变更,制定标准化运维流程,降低系统故障率。
3. 快速定位并解决集群运行中的各类故障(如数据丢失、任务阻塞、资源瓶颈等),输出故障分析报告与预防方案。
4. 参与自动化运维平台建设,通过脚本或工具实现集群部署、监控告警、日志分析的自动化,提升运维效率。
5. 配合数据团队完成数据迁移、灾备演练等专项工作,保障数据安全与业务连续性。
任职要求
1. 大专及以上学历,计算机、软件工程等相关专业,3年以上大数据运维经验。
2. 精通Hadoop生态核心组件的原理与运维,熟悉Linux系统(CentOS/Ubuntu)的命令操作与系统调优。
3. 掌握至少一种自动化运维工具(如Ansible、SaltStack)或脚本语言(Python/Shell),具备自动化运维方案设计能力。
4. 熟悉监控体系搭建,能使用Prometheus、Grafana等工具实现集群指标监控与告警。
5. 具备大规模集群故障排查经验,能独立分析解决分布式系统中的复杂问题,有较强的问题定位与解决能力。
1. 负责Hadoop生态集群(HDFS、YARN、MapReduce、Hive、Spark等)的日常运维、监控与性能优化,保障集群高可用与稳定性。
2. 主导集群扩容、版本升级与配置变更,制定标准化运维流程,降低系统故障率。
3. 快速定位并解决集群运行中的各类故障(如数据丢失、任务阻塞、资源瓶颈等),输出故障分析报告与预防方案。
4. 参与自动化运维平台建设,通过脚本或工具实现集群部署、监控告警、日志分析的自动化,提升运维效率。
5. 配合数据团队完成数据迁移、灾备演练等专项工作,保障数据安全与业务连续性。
任职要求
1. 大专及以上学历,计算机、软件工程等相关专业,3年以上大数据运维经验。
2. 精通Hadoop生态核心组件的原理与运维,熟悉Linux系统(CentOS/Ubuntu)的命令操作与系统调优。
3. 掌握至少一种自动化运维工具(如Ansible、SaltStack)或脚本语言(Python/Shell),具备自动化运维方案设计能力。
4. 熟悉监控体系搭建,能使用Prometheus、Grafana等工具实现集群指标监控与告警。
5. 具备大规模集群故障排查经验,能独立分析解决分布式系统中的复杂问题,有较强的问题定位与解决能力。
工作地点
南宁青秀区龙光世纪中心-A座

认证资质
营业执照信息

更新于 今天





