该职位已失效,看看其他机会吧

运维开发工程师

1.5-2万
  • 深圳南山区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

服务器运维网络运维PythonJenkins人工智能计算机软件
岗位职责:
1. 负责公司项目的标准化、规范化部署体系建设,设计并落地应用从开发、测试到生产环境的自动化发布流程,提升交付效率与稳定性。
2. 构建和维护 CI/CD 流水线,支持多服务、多环境(开发 / 测试 / 预发 / 生产)的持续集成与持续部署,实现版本可追溯、可回滚。
3. 负责系统运行状态的监控、告警与日志体系建设,覆盖应用服务、模型服务、GPU 资源及底层基础设施,保障系统稳定运行。
4. 参与服务器与云资源的统一管理与规划,包括计算、存储、网络资源的分配、扩容与成本优化。
5. 负责 GPU 集群的搭建、运维与调度,支持大模型训练与推理服务的高效运行,保障资源利用率与服务 SLA。
6. 参与系统高可用、高并发与容灾方案设计,推动平台在规模化应用场景下的稳定运行。
7. 编写并维护运维相关技术文档与规范,持续推进运维流程自动化与标准化。
任职要求:
1. 计算机科学、软件工程或相关专业本科及以上学历,具备扎实的计算机系统基础。
2. 熟悉 Linux 操作系统,具备较强的服务器环境部署、排障与性能调优能力。
3. 熟练使用 Docker,了解并掌握 Kubernetes(K8s)等容器编排技术,有实际生产环境经验。
4. 熟悉至少一种 CI/CD 工具链(如 GitLab CI、Jenkins、Argo CD 等),具备自动化发布与回滚实践经验。
5. 熟悉常见监控与告警体系(如 Prometheus、Grafana、Alertmanager、ELK / Loki 等),能够独立搭建并优化监控方案。
6. 具备一定的脚本与开发能力,熟练使用 Shell、Python 或 Go 进行运维自动化开发。
7. 熟悉服务器资源管理与网络基础知识,对系统稳定性、可用性与安全性有较强责任感。
加分项:
1、有 GPU 服务器或 GPU 集群运维经验,熟悉 CUDA、NVIDIA 驱动、NCCL 及相关生态。 •
2、有大模型训练或推理服务(如 vLLM、Triton、TensorRT-LLM 等)的部署与运维经验。
3、了解 SRE 理念,有 SLA / SLO / 错误预算等实践经验。
查看全部

工作地点

深圳南山区科技园高新中一道9号

职位发布者

沈女士/hr

昨日活跃
立即沟通
公司Logo光启技术股份有限公司
光启是一家战略创新型企业,也是领先的新一代超材料技术和人工智能覆盖技术提供商,旗下拥有光启技术(SZ 002625)与光启科学(HK00439)两家上市公司。光启成立于2010年,由五位美国杜克大学、英国牛津大学博士归国创建。总部位于中国深圳,创新机构遍布5大洲21个国家与地区。光启拥有一系列源头创新和产业化平台,包括以深圳光启高等理工研究院为核心的新型研发机构群,超材料电磁调制技术国家重点实验室及多个省市级重点实验室,企业博士后科研工作站等研究机构。此外,光启也是全国电磁超材料技术及制品标准化技术委员会的秘书单位、深圳超材料产业联盟发起者。光启掌握高性能建模、高并发计算、精细制造、大范围光电感知覆盖、高效率测试等五大内核技术,并拥有相关自主知识产权。截至2021年,光启累计申请专利5850件,获得授权专利3616件。在超材料领域专利申请总量位居全球第一,实现超材料底层技术专利覆盖。光启领衔起草并发布了全球超材料领域国家标准《电磁超材料术语》,打破了欧美对前沿科技的技术和标准垄断,奠定了我国在超材料技术研究和标准转化上的国际领先地位。光启以产业化需求为牵引,将实验室的超材料科学研究,转化为工程实践,构建了完整的超材料工业体系。光启五大内核技术与尖端装备行业结合,形成了新一代超材料技术,并率先应用到了我国尖端装备上,在世界超材料产业化竞争中抢占了先机,成为行业引领者。在尖端技术垂直发展的过程中,光启五大内核技术与数字信息产业结合,形成了可应用于城市管理、教育、金融、医疗、商业、市民服务等众多领域的人工智能覆盖技术,有效提升了社会治理与行业运营效率。未来,光启将聚焦尖端装备产业和数字信息产业,进一步推进装备智能化升级和新一代数字基础设施建设,为建设科技强国做出贡献。我们提供具有竞争力的薪酬福利,灵活多样的职业发展通道,以及积极求是的工作氛围。
公司主页