一、职位描述
1. 负责数据中台产品(K8s容器化架构)的全流程实施与运维,包括环境搭建、资源分配、集群部署与日常维护;
2. 保障中台各类应用服务SLA,覆盖性能调优、日志异常分析、服务弹性扩缩容、版本迭代、配置与权限全生命周期管理及变更管控;
3. 承担Hadoop、HBase、Kafka、Flink、Doris等大数据核心引擎集群的运维工作,涵盖7×24小时监控、周期性巡检、故障应急响应、服务启停、集群扩容缩容及资源精细化管控;
4. 攻坚平台技术瓶颈,快速响应并解决突发故障(如数据链路中断、集群性能雪崩、容器资源抢占等),建立并优化故障应急预案;
5. 协同研发团队推进运维体系标准化,落地自动化运维工具与流程,提升运维效率与平台稳定性。
二、任职要求
1.35岁以下,本科及以上学历,计算机/软件工程等相关专业,5年及以上大数据平台运维实战经验,有中台运维经验优先;
2. 精通Ansible等自动化运维工具,具备K8s集群搭建、资源调度、容器编排的实战能力,能独立完成K8s环境下大数据组件的部署与运维;
3. 深度掌握大数据生态圈核心组件(Kafka、Hive、Hadoop、Spark、Flink、Doris)的原理与运维,熟悉组件间协同架构及故障排查逻辑;
4. 熟练使用Flink CDC、Sqoop、DataX等数据同步工具及主流任务调度平台,能保障数据流转链路的稳定性;
5. 具备优秀的跨团队沟通能力,抗压性强,有强烈的责任心与团队协作意识,可独立应对复杂技术故障并推动问题闭环。