更新于 今天

北京 - 运维工程师(云原生架构方向)

1.5-2.5万
  • 北京东城区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

系统运维Kubernetes
一、核心岗位职责
1. 云原生平台运维与架构
负责生产级 Kubernetes 集群的全生命周期管理,包括高可用架构设计、版本升级、网络调优(CNI 深度排查)及故障应急。要求能基于 K8s API、CRD 及 Operator 模式进行二次开发,构建自动化运维平台,实现资源编排、灰度发布及配置管理的 API 化。
2. 分布式中间件深度治理(重点)
独立负责以下核心基础设施的集群建设、监控体系搭建及稳定性保障:
· Redis:主从/哨兵/Cluster 模式运维,RDB/AOF 持久化策略优化,缓存穿透/雪崩防护;
· Nacos:注册中心与配置中心高可用集群维护(MySQL 持久化),服务发现性能调优,配置灰度发布;
· RocketMQ:NameServer+Broker 架构运维,消息堆积监控与消费延迟治理,事务消息及轨迹追踪,跨集群复制;
· MinIO:分布式对象存储集群运维,纠删码策略配置,S3 兼容性测试及与 K8s CSI 集成;
· VictoriaMetrics:作为 Prometheus 替代或增强方案,负责 vminsert/vmselect/vmstorage 集群运维,高基数(High Cardinality)监控数据治理,长期存储策略设计。
3. 信创与国产化适配(优先项)
主导或参与信创环境适配,在国产 OS(麒麟/统信 UOS/欧拉)及 ARM 架构(鲲鹏/飞腾)下完成 K8s 及中间件的部署、镜像编译(支持 ARM64)、性能调优及兼容性修复,输出信创最佳实践文档。
4. 自动化与可观测体系建设
开发 Shell/Python/Go 运维脚本及自动化平台,实现中间件故障自愈(如 Redis 自动切换、MQ 自动扩容)。构建统一监控体系(Prometheus + VictoriaMetrics + Grafana),定制中间件专属 SLI/SLO。
二、硬性任职要求基础能力
· 5 年以上 Linux 生产环境运维经验,深入理解内核、网络(TCP/IP、DNS)及存储原理;
· 精通 Shell 脚本,能独立完成复杂自动化脚本(含并发控制、错误处理、日志分析);
· 熟悉 Python 或 Go 至少一门语言,具备实际运维工具开发经验。
云原生技术(必须)
· 精通 Kubernetes:深入掌握 Pod、Deployment、StatefulSet(有状态应用管理)、网络模型(CNI/Service/DNS)、存储(PV/PVC/StorageClass);掌握k8s/k3s集群的高可用与故障恢复;
· 掌握 Helm、Kustomize、GitOps(ArgoCD/Flux);
· 熟悉 Operator 开发模式,能基于 Client-go 进行二次开发;
· 熟悉云原生可观测体系:VictoriaMetrics/Prometheus 监控采集、Grafana 可视化、日志方案(VictoriaLogs/ELK/Loki)。
中间件深度运维(必须掌握)
不仅要求"会部署",更要求具备故障排查、性能调优、架构设计能力:
· Redis:掌握主从复制原理、哨兵故障转移机制、Cluster 数据分片及迁移;能处理热点 Key 大对象、内存碎片整理、缓存雪崩防护;熟悉 Redis 6/7 ACL 权限体系;
· Nacos:理解服务注册发现原理(临时实例 vs 持久化实例)、Distro 协议一致性、配置变更长轮询机制;能排查服务上下线延迟、配置推送失败等问题;
· RocketMQ:掌握 CommitLog 与 ConsumeQueue 存储机制,理解同步/异步刷盘、主从复制(Sync/Async Master);能处理消息堆积、消费延迟、顺序消息并发问题;
· MinIO:掌握 Erasure Coding 纠删码原理、Bitrot 校验;熟悉分布式锁、多租户隔离、Bucket 生命周期策略;能处理硬盘故障替换、集群扩容缩容;
· VictoriaMetrics:理解其相比 Prometheus 的存储优势(高压缩率、高查询性能);掌握 cluster 模式组件交互、数据 retention 策略、高基数标签治理;熟悉 PromQL/MetricsQL 高级查询。
二次开发能力
· 熟悉 Kubernetes REST API 及常用云组件 API;
· 能开发自定义 Controller、Webhook 或运维自动化平台;
三、加分项
1. 信创与国产化
· 国产操作系统:熟悉麒麟 V10、统信 UOS、欧拉(OpenEuler)的系统管理、内核参数调优、软件源适配;
· 国产芯片:具备 ARM64(鲲鹏 920、飞腾 FT-2000/2500) 或 x86(海光、兆芯) 架构下的 K8s 与中间件运维经验;
· 信创中间件适配:解决过 Redis、TiDB、RocketMQ 等在 ARM 架构下的编译安装、JDK 兼容(如毕昇 JDK/ dragonwell)、性能调优问题;
2. 证书
· 认证:CKA/CKS、TiDB PCTA/PCTP、Elastic Certified Engineer、Redis University 认证;
3. 架构与治理经验
· 有 100+ 节点 K8s 集群或 PB 级数据中间件(ES/TiDB/MinIO)运维经验;
· 主导过中间件上云(K8s 化)或信创迁移项目,具备从传统架构到云原生架构的完整迁移经验;
· 熟悉等保 2.0、国密算法(SM2/SM3/SM4)在中间件链路中的应用。

工作地点

北京东城区贡院六号

认证资质

营业执照信息

职位发布者

陈鑫/人事经理

昨日活跃
立即沟通
公司Logo中电信翼康科技有限公司
中电信翼康科技有限公司(以下简称“中电信翼康公司”)是中国电信股份有限公司旗下全资子公司,成立于2023年6月,中电信翼康公司深入贯彻党中央重要指示精神,接应国家“健康中国”战略,落实中国电信集团“云改数转”战略,加速行业布局,创新驱动业务发展,打造差异化竞争优势。作为中国电信集约开展卫生健康产业数字化业务的平台型、能力型、科技型公司,是从事卫生健康产业数字化业务能力建设的市场化经营主体,致力于在卫健业务领域为客户和合作伙伴赋能。
公司主页