职位描述
容器与编排AnsibleTERRAFORMGrafanaPythonGOOPENCODECLAUDE CODE
岗位职责:
【人员定位】
主要负责国内外SaaS系统运维/公司内部数智化转型,日常工作中会有10%-30%负责流水线相关的开发维护和Oncall工作。
任职资格:
【岗位核心要求】
1. 3年以上大型云原生环境运维经验: 必须有 Kubernetes (K8s) 生产环境实战经验,处理过集群升级、性能调优或大规模调度。
2. SaaS/订阅制转型经验: 参与过从“私有化部署”向“公有云SaaS”转型的过程,或有千万级用户量的账号授权、支付中心运维经验。
3. 有丰富的可观测性系统开发、搭建经验: 不仅仅会看监控,更要具备从 0 到 1 搭建基于 SLI/SLO 体系的能力,能通过指标预防事故。
4. 流水线开发管理经验(占据日常工作10%-30%):有各个平台(windows linux arm)的流水线开发经验,管理过超过100并发的流水线。
【技术技能清单】
1. 容器与编排(核心底座)
精通 Kubernetes: 熟悉 Pod 调度、网络插件 (Calico/Flannel)、Ingress 控制器以及 Helm Chart 包管理。
容器安全: 熟悉镜像扫描、容器运行时安全以及 K8s RBAC 权限管理。
2. 基础设施即代码 (IaC)
工具: 精通 Terraform 或 Ansible,实现云服务器、数据库、SLB 等资源的自动化创建与变更。
版本控制: 熟悉 GitOps 工作流(如 ArgoCD 或 Jenkins 管道)。
3. 监控与链路追踪
监控栈: 精通 Prometheus + Grafana,能够编写复杂的 PromQL 语句。
日志/链路: 熟悉 ELK Stack (Elasticsearch/Logstash/Kibana) 或 Loki;熟悉 Skywalking、Jaeger 等全链路追踪工具。
4. 中间件与数据库
数据库: 熟悉 MySQL/PostgreSQL 的主从高可用架构、读写分离及索引优化。
缓存/消息: 熟悉 Redis 缓存策略及 Kafka/RabbitMQ 的消息堆积处理。
5. 开发能力
编程: 熟练使用 Go 或 Python。能够编写自定义 Exporter、自动化巡检脚本或 K8s Operator。
加分项:有工具开发经验;有结合AI大模型开发的经验
6. 订阅制专项技能
身份认证: 熟悉 OIDC、OAuth 2.0、SAML 等协议,确保订阅用户登录认证的高可靠。
云成本优化 (FinOps): 有对云账单进行分析、利用弹性伸缩减少资源浪费的实际案例。
7. 在工作中有深度结合AI的能力
AI使用:能够利用AI能力来简化/提效自己的工作。
工具掌握(包括不限于):
- 有使用OpenCode、Claude code等工具,调用大模型经验。
- 熟悉skill的使用。
8. 对内服务的部署和运维
支撑公司内部数智化建设:和公司各部门一起,共同完成数智化底座建设,主要提供部署支持,系统稳定性保障等。
9. 有流水线开发维护经验
掌握技能(包括不限于):
- 熟悉jenkins、gitlab流水线开发。
- 了解各平台执行机接入方式。
- 了解如何系统化管理流水线执行机资源。
- 了解复杂结构的流水线设计,知道如何将一些复杂流程工具化。
【软性能力】
1. AI 技术的敏感性:有意识的将一些合适的AI技术引入工作中,在保证质量的情况下,给日常工作提效。
2. 故障排查能力: 能在复杂的分布式系统下,通过日志和指标快速定位幽灵故障,可以通过分析工具或者开发脚本快速定位故障。
3. 推动力: SRE需要主动推进一些工作向前推进,因此需要极强的沟通能力和不容忍过渡/临时方案的原则性。
【人员定位】
主要负责国内外SaaS系统运维/公司内部数智化转型,日常工作中会有10%-30%负责流水线相关的开发维护和Oncall工作。
任职资格:
【岗位核心要求】
1. 3年以上大型云原生环境运维经验: 必须有 Kubernetes (K8s) 生产环境实战经验,处理过集群升级、性能调优或大规模调度。
2. SaaS/订阅制转型经验: 参与过从“私有化部署”向“公有云SaaS”转型的过程,或有千万级用户量的账号授权、支付中心运维经验。
3. 有丰富的可观测性系统开发、搭建经验: 不仅仅会看监控,更要具备从 0 到 1 搭建基于 SLI/SLO 体系的能力,能通过指标预防事故。
4. 流水线开发管理经验(占据日常工作10%-30%):有各个平台(windows linux arm)的流水线开发经验,管理过超过100并发的流水线。
【技术技能清单】
1. 容器与编排(核心底座)
精通 Kubernetes: 熟悉 Pod 调度、网络插件 (Calico/Flannel)、Ingress 控制器以及 Helm Chart 包管理。
容器安全: 熟悉镜像扫描、容器运行时安全以及 K8s RBAC 权限管理。
2. 基础设施即代码 (IaC)
工具: 精通 Terraform 或 Ansible,实现云服务器、数据库、SLB 等资源的自动化创建与变更。
版本控制: 熟悉 GitOps 工作流(如 ArgoCD 或 Jenkins 管道)。
3. 监控与链路追踪
监控栈: 精通 Prometheus + Grafana,能够编写复杂的 PromQL 语句。
日志/链路: 熟悉 ELK Stack (Elasticsearch/Logstash/Kibana) 或 Loki;熟悉 Skywalking、Jaeger 等全链路追踪工具。
4. 中间件与数据库
数据库: 熟悉 MySQL/PostgreSQL 的主从高可用架构、读写分离及索引优化。
缓存/消息: 熟悉 Redis 缓存策略及 Kafka/RabbitMQ 的消息堆积处理。
5. 开发能力
编程: 熟练使用 Go 或 Python。能够编写自定义 Exporter、自动化巡检脚本或 K8s Operator。
加分项:有工具开发经验;有结合AI大模型开发的经验
6. 订阅制专项技能
身份认证: 熟悉 OIDC、OAuth 2.0、SAML 等协议,确保订阅用户登录认证的高可靠。
云成本优化 (FinOps): 有对云账单进行分析、利用弹性伸缩减少资源浪费的实际案例。
7. 在工作中有深度结合AI的能力
AI使用:能够利用AI能力来简化/提效自己的工作。
工具掌握(包括不限于):
- 有使用OpenCode、Claude code等工具,调用大模型经验。
- 熟悉skill的使用。
8. 对内服务的部署和运维
支撑公司内部数智化建设:和公司各部门一起,共同完成数智化底座建设,主要提供部署支持,系统稳定性保障等。
9. 有流水线开发维护经验
掌握技能(包括不限于):
- 熟悉jenkins、gitlab流水线开发。
- 了解各平台执行机接入方式。
- 了解如何系统化管理流水线执行机资源。
- 了解复杂结构的流水线设计,知道如何将一些复杂流程工具化。
【软性能力】
1. AI 技术的敏感性:有意识的将一些合适的AI技术引入工作中,在保证质量的情况下,给日常工作提效。
2. 故障排查能力: 能在复杂的分布式系统下,通过日志和指标快速定位幽灵故障,可以通过分析工具或者开发脚本快速定位故障。
3. 推动力: SRE需要主动推进一些工作向前推进,因此需要极强的沟通能力和不容忍过渡/临时方案的原则性。
工作地点
苏州同元软控信息技术有限公司苏州工业园区淞北路333号D1幢

公司信息
公司介绍
苏州同元软控信息技术有限公司成立于2008年,总部位于苏州市工业园区,是为装备制造业提供新一代系统级设计与仿真验证工业软件产品研发、工程服务及整体解决方案的高科技企业。同元软控的产品和服务已经广泛应用于航天、航空、能源、车辆、船舶、教育等行业,为国家系列重大工程提供了数字化设计支撑。 苏州同元经过团队20年技术积累、公司12年持续研发,全面掌握了自CAD、CAE之后的新一代数字化核心技术——多领域统一建模与仿真技术,采用国际多领域统一建模规范Modelica,形成目前核心产品——系统设计与仿真验证平台MWORKS。MWORKS支持基于模型的系统设计、仿真验证、模型集成、虚拟试验、运动维护以及协同研发。MWORKS是亚洲唯一完全自主的系统仿真软件,完全自主研发的内核是国际上六个商品化Modelica编译求解引擎之一,并已为国际知名汽车工业软件供应商提供内核授权,整体水平位居国际前列。 依托于完全自主的系统设计与仿真验证平台MWORKS,已经实现或正在实现对一系列国内空白的设计仿真软件的替代,包括系统仿真软件、科学工程计算与建模仿真软件等平台软件,机械多体仿真分析软件、一维流体仿真分析软件、电气仿真分析软件等专业软件,以及航天、航空、核能、汽车等行业仿真软件。
工商信息
企业名称 苏州同元软控技术股份有限公司
企业类型 股份有限公司(非上市、自然人投资或控股)
法人代表 周凡利
经营状态 存续
成立时间 2007-03-30
注册资本 2296.67万元
认证资质
营业执照信息

更新于 今天




