岗位职责:
1. 负责搭建态势感知平台测试环境和维护,产品发布时进行可交付性验收
2. 故障的排查和协同处理(7*24响应)
3. 负责建立维护产品运维知识库(SOP),交付运维团队的技术培训,内容涵盖态势感知平台组件部署、日常操作、故障排查、实操演练等,提升问题排查效率及应急响应能力
4. 跨部门协作,提供态势感知平台运维优化建议,提出系统改进方案
5. 协作与优化跨团队协作优化部署架构,制定容灾预案和性能调优方案
岗位需求:
1. 计算机专业,5年以上运维经验,有中大型Hadoop集群管理或微服务架构实践经验优先
2. 精通 Linux,掌握内核参数优化等运维技能
3. 深入理解组件Hadoop/Hive/Hbase/Spark/Trino的工作原理、运维管理和参数优化
4. 精通中间件Nginx、Kafka、Redis、MySQL、ClickHouse、MongoDB、Nebula Graph工作原理和运维
5. 精通Kubernetes /Docker,熟悉网络协议
6. 掌握脚本语言并精通其中的一种语言并有工程编写能力优先
7. 软技能具备问题分析能力、抗压性及团队协作精神,能推动技术方案落地
8. 可以接收短期出差