岗位职责:
收集和分析来自集群组件和服务的指标,以帮助性能调整和故障查找
与核心工程和服务工程团队合作,通过严格的测试和发布程序来改进服务
参与系统设计咨询、平台管理和容量规划
通过自动化和提升创造可持续的系统和服务
平衡功能开发速度和可靠性与明确定义的服务水平目标
确认集群的运行状况,以便在开发人员部署新工作负载时提供帮助
积极主动地寻找机会,让您和您的团队能够为IKP平台提供更好的客户服务、可靠性和可扩展性
职责要求:
必须具备较强的英语口头和书面沟通技能
能够用python/Java/shell语言编写脚本,如Bash或PowerShell
能够使用一种或多种高级语言(如Python或Go)进行编程(结构化和面向对象)
有使用Kubernetes的经验,最好是GKE本地(Anthos)
主动发现问题、需要改进的领域和性能瓶颈
加分项:高水平的Kubernetes认证(CKA或CKS - CKAD将被考虑)
拥有VMware和其他虚拟化平台技术的经验
作为早期采用者与供应商合作/合作的经验
在敏捷环境中工作的经验。
良好的中英文书面和口头沟通技巧。