职位描述
操作系统运维数据库运维NginxDockerPythonShellKubernetesAI工具应用运维软件/IT服务云计算
岗位职责 :
1、负责公司业务系统及相关运维平台的日常运行维护工作,包括应用部署、环境配置、版本发布、运行监控、巡检检查、问题跟踪和故障处理,保障系统稳定运行。
2、负责应用系统发布和变更管理,配合研发团队完成持续集成、持续部署、灰度发布、回滚验证、发布检查等工作,降低发布风险,提高交付效率。
3、负责应用运行状态监控与告警处理,建设和维护监控指标、日志采集、链路追踪、告警规则和运行报表,及时发现并推动解决系统异常。
4、负责操作系统、数据库、中间件等基础组件的部署、配置、监控和日常维护,包括Linux/Windows、MySQL/PostgreSQL/Redis、Nginx、Kafka、RabbitMQ、Elasticsearch 等常用组件的运维支持。
5、负责应用系统故障排查和应急处理,能够根据日志、监控、链路、资源使用情况等信息定位问题,配合研发、测试、网络、安全等团队完成故障恢复和复盘改进。
6、负责 Kubernetes 集群及容器化应用的日常运维工作,包括容器部署、资源配置、服务检查、Pod 异常处理、日志查看、扩缩容、应用升级和运行优化等。
7、负责自动化运维脚本和工具的编写与维护,围绕部署发布、巡检检查、日志分析、告警处理、备份恢复等场景提升运维效率。
8、参与系统高可用、容灾备份、安全加固和稳定性治理工作,配合完成备份策略、恢复演练、权限检查、漏洞整改、风险巡检和应急预案执行。
9、参与 AI 工具在运维场景中的应用落地,如智能告警分析、知识库问答、日志辅助分析、运维工单分类、故障处理建议等,提高运维响应效率。
10、负责运维文档和知识库建设,包括部署手册、操作手册、应急预案、巡检清单、故障案例、变更记录和问题复盘文档等。
能力要求 :
1、本科及以上学历,计算机、软件工程、信息管理、网络工程等相关专业优先;具备3年以上应用运维、系统运维、平台运维或云原生运维相关经验。
2、熟悉 Linux/Windows 操作系统运维,掌握系统服务管理、文件系统、网络配置、权限管理、资源监控、日志分析和常见故障排查方法。
3、熟悉 Shell、Python 或 PowerShell 等脚本语言,能够编写常用自动化运维脚本,用于部署、巡检、备份、日志处理和批量操作等场景。
4、熟悉常用数据库和缓存组件的基础运维工作,如 MySQL、PostgreSQL、Redis、MongoDB 等,了解部署配置、备份恢复、主从复制、性能监控和常见问题处理。
5、熟悉常用中间件和基础服务组件的运维管理,如 Nginx、Kafka、RabbitMQ、Elasticsearch 等,能够完成配置调整、运行监控、日志排查和故障处理。
6、熟悉 Docker 和 Kubernetes 基础运维操作,能够完成容器化应用部署、服务检查、资源调整、日志查看、故障排查和应用升级;熟悉 Helm、Ingress、ConfigMap、Secret、PVC 等常用对象者优先。
7、熟悉 CI/CD、监控告警、日志分析、可观测性相关工具或平台,如 Jenkins、GitLab CI、Prometheus、Grafana、ELK、SkyWalking、Zabbix 等,有实际使用经验者优先。
8、具备较强的问题分析和故障排查能力,能够在高压场景下快速定位问题、组织处理、恢复业务,并参与故障复盘和改进。
9、具备良好的安全意识和规范意识,了解账号权限管理、漏洞整改、补丁升级、基线检查、备份恢复、访问控制等基础安全运维要求。
10、具备良好的沟通协作能力和服务意识,能够与研发、测试、网络、安全、业务等团队高效协作,推动问题闭环。
11、了解云平台或混合云环境运维,熟悉主流云厂商基础产品,如云主机、负载均衡、对象存储、云数据库、容器服务、云监控等,有实际运维经验者优先。
12、了解 AI 产品或大模型工具在运维场景中的使用方式,如智能问答、日志分析、告警归因、知识库检索、工单辅助处理等;有相关落地经验者优先。
13、具备相关认证者优先,如软考信息系统管理工程师、系统规划与管理师、网络工程师、信息安全工程师,或 CKA、CKAD、云厂商认证等。
1、负责公司业务系统及相关运维平台的日常运行维护工作,包括应用部署、环境配置、版本发布、运行监控、巡检检查、问题跟踪和故障处理,保障系统稳定运行。
2、负责应用系统发布和变更管理,配合研发团队完成持续集成、持续部署、灰度发布、回滚验证、发布检查等工作,降低发布风险,提高交付效率。
3、负责应用运行状态监控与告警处理,建设和维护监控指标、日志采集、链路追踪、告警规则和运行报表,及时发现并推动解决系统异常。
4、负责操作系统、数据库、中间件等基础组件的部署、配置、监控和日常维护,包括Linux/Windows、MySQL/PostgreSQL/Redis、Nginx、Kafka、RabbitMQ、Elasticsearch 等常用组件的运维支持。
5、负责应用系统故障排查和应急处理,能够根据日志、监控、链路、资源使用情况等信息定位问题,配合研发、测试、网络、安全等团队完成故障恢复和复盘改进。
6、负责 Kubernetes 集群及容器化应用的日常运维工作,包括容器部署、资源配置、服务检查、Pod 异常处理、日志查看、扩缩容、应用升级和运行优化等。
7、负责自动化运维脚本和工具的编写与维护,围绕部署发布、巡检检查、日志分析、告警处理、备份恢复等场景提升运维效率。
8、参与系统高可用、容灾备份、安全加固和稳定性治理工作,配合完成备份策略、恢复演练、权限检查、漏洞整改、风险巡检和应急预案执行。
9、参与 AI 工具在运维场景中的应用落地,如智能告警分析、知识库问答、日志辅助分析、运维工单分类、故障处理建议等,提高运维响应效率。
10、负责运维文档和知识库建设,包括部署手册、操作手册、应急预案、巡检清单、故障案例、变更记录和问题复盘文档等。
能力要求 :
1、本科及以上学历,计算机、软件工程、信息管理、网络工程等相关专业优先;具备3年以上应用运维、系统运维、平台运维或云原生运维相关经验。
2、熟悉 Linux/Windows 操作系统运维,掌握系统服务管理、文件系统、网络配置、权限管理、资源监控、日志分析和常见故障排查方法。
3、熟悉 Shell、Python 或 PowerShell 等脚本语言,能够编写常用自动化运维脚本,用于部署、巡检、备份、日志处理和批量操作等场景。
4、熟悉常用数据库和缓存组件的基础运维工作,如 MySQL、PostgreSQL、Redis、MongoDB 等,了解部署配置、备份恢复、主从复制、性能监控和常见问题处理。
5、熟悉常用中间件和基础服务组件的运维管理,如 Nginx、Kafka、RabbitMQ、Elasticsearch 等,能够完成配置调整、运行监控、日志排查和故障处理。
6、熟悉 Docker 和 Kubernetes 基础运维操作,能够完成容器化应用部署、服务检查、资源调整、日志查看、故障排查和应用升级;熟悉 Helm、Ingress、ConfigMap、Secret、PVC 等常用对象者优先。
7、熟悉 CI/CD、监控告警、日志分析、可观测性相关工具或平台,如 Jenkins、GitLab CI、Prometheus、Grafana、ELK、SkyWalking、Zabbix 等,有实际使用经验者优先。
8、具备较强的问题分析和故障排查能力,能够在高压场景下快速定位问题、组织处理、恢复业务,并参与故障复盘和改进。
9、具备良好的安全意识和规范意识,了解账号权限管理、漏洞整改、补丁升级、基线检查、备份恢复、访问控制等基础安全运维要求。
10、具备良好的沟通协作能力和服务意识,能够与研发、测试、网络、安全、业务等团队高效协作,推动问题闭环。
11、了解云平台或混合云环境运维,熟悉主流云厂商基础产品,如云主机、负载均衡、对象存储、云数据库、容器服务、云监控等,有实际运维经验者优先。
12、了解 AI 产品或大模型工具在运维场景中的使用方式,如智能问答、日志分析、告警归因、知识库检索、工单辅助处理等;有相关落地经验者优先。
13、具备相关认证者优先,如软考信息系统管理工程师、系统规划与管理师、网络工程师、信息安全工程师,或 CKA、CKAD、云厂商认证等。
奖金绩效
月薪含绩效工资,考核发放;年终奖根据公司经营业绩及考核确定
工作地点
海南省海口市美兰区会展楼1-2层海南省大数据发展中心

认证资质
营业执照信息

更新于 今天






