岗位职责:
1、协助项目经理进行项目计划制定和执行,负责 AI 平台规划、安装、部署、测试,保障系统稳定高效运行;
2、负责 Kubernetes 私有集群搭建、运维、监控、性能调优及高可用保障;
3、处理 Kubernetes 集群的疑难问题,包括网络(CNI)、存储(CSI)、安全(RBAC/OPA)等方向的故障排查;
4、 定期更新和升级 AI 系统,解决系统中的问题,提高系统的性能;
5、 编写项目文档,包括需求文档、测试文档、用户手册等;配合售后为客户提供 AI 平台技术支持与使用指导。
任职要求:
1、1年及以上相关工作经验。计算机、人工智能、数据科学等相关专业专科及以上学历。
2、熟练掌握容器和K8S技术。
3、熟悉 Kubernetes 生态相关技术(如 Service Mesh、harbor、Helm、kubekey、PV/PVC、Hami、Prometheus 等)。
4、了解Nvidia / 国产GPU卡,监控、调度等相关技术。
5、有大模型训练及推理工作经验的优先。
6、 逻辑清晰,沟通协作能力强,能承受多项目并行交付压力。
驻场地点:北京六环外
福利:双休、五险一金、带薪年假、商业意外险