更新于 2月3日

Kubernetes / 集群平台开发工程师

2.5-4万·14薪
  • 上海浦东新区
  • 5-10年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 团队执行强

职位描述

云计算/大数据
岗位职责
• 负责构建和维护算力事业部的 Kubernetes 集群平台:包括 GPU 集群、边缘集群、混合云集群。
• 开发 Kubernetes Operator、CRD、调度插件,支持模型部署、推理服务、算力编排。
• 实现自动化:节点接入、健康检查、滚动升级、节点隔离、故障恢复。
• 参与构建 “云–边–端一体化集群”,负责 KubeEdge / Knative / 轻量容器运行时落地。
• 和调度团队、模型团队协作,提供可靠的:
◦ GPU 驱动管理
◦ MIG / 多实例 GPU 配置
◦ 网络优化(RDMA、RoCE)
• 提升平台的可观测性与安全性。
岗位要求
• 精通 Kubernetes 原理,有 CRD/Operator 开发经验(至少一个可交付项目级经验)。
• 熟练使用 Golang。
• 熟悉容器运行时(Docker、Containerd、CRI)。
• 熟悉 Prometheus、Grafana、Loki 等可观测性工具。
• 对分布式系统、服务治理、网络有基础理解。

工作地点

上海浦东新区张江科学之门

职位发布者

纪先生/HR

当前在线
立即沟通
公司Logo秦淮数据
秦淮数据集团作为新兴市场领先的新一代超大规模算力基础设施综合服务提供商,于2020年10月1日在纳斯达克全球精选市场完成上市,证券交易代码:CD。集团专注于为全球数字领导者提供全栈式新一代超大规模算力集群解决方案,包括数字基础设施的开发建设、综合能源、装备制造及运营管理等生态链产品与服务。秦淮数据集团下设独立运营的子品牌“秦淮数据”和"Bridge Data Centres",业务遍及包括中国在内的亚太新兴市场。集团坚持服务“领军企业关键资产运营”赛道,深耕数字基础设施生态规划、投资、设计、建造和运营,努力为人类更普惠的美好数字生活提供坚实的基础。自成立以来,秦淮数据集团一直致力于打造“开放、多元、包容、平等”的工作氛围,汇聚来自不同国家、种族、民族、宗教信仰的员工,为每位员工和每位未来的合作伙伴提供具有国际视野的复合型成长发展平台。同时,集团积极倡导性别平等,大力支持女性员工的个人发展。自2020年起,集团发布“Better U”女性领导力计划,开展一些列支持女性职业发展的领导力项目,发现更多具有远大梦想、执行能力强和理解行业的菁英女性。2020年,秦淮数据集团管理层女性占比40%,远高于行业平均水平以及全球企业董事会女性平均占比。全球权威电信杂志《CAPACITY》高度肯定秦淮数据集团在保持性别平等和营造多元文化方面所作的努力,授予秦淮数据集团2020年数字基础行业“GLOBAL WOMEN”称号。在关注员工发展的同时,秦淮数据集团也充分利用自身优势为社会做出卓越的贡献。2020年Covid-19爆发之际,秦淮数据集团几乎在第一时间启动应急响应机制,在确保人员安全的情况下保障客户业务7*24小时稳定运行。此外,集团紧急定制防控前线紧缺的高端消毒设备,成为当时中国数字基础设施行业最大的一笔实物捐赠。推动区域经济发展也是秦淮数据集团履行社会责任的重要体现。秦淮数据集团注重产业链延伸,将数字经济与乡村振兴结合,探索“算力+农业+观光”于一体的数字经济聚落。据估算,集团相继提供高新技术工作岗位及间接工作岗位数千个,还通过税留当地,带动生态合作上下游企业缴纳税收,为当地创造经济效益。
公司主页