更新于今天

应用运维工程师

8000-15000元·14薪

海口美兰区
3-5年
本科
全职

操作系统运维数据库运维NginxDockerPythonShellKubernetesAI工具应用运维软件/IT服务云计算

岗位职责：
1、负责公司业务系统及相关运维平台的日常运行维护工作，包括应用部署、环境配置、版本发布、运行监控、巡检检查、问题跟踪和故障处理，保障系统稳定运行。
2、负责应用系统发布和变更管理，配合研发团队完成持续集成、持续部署、灰度发布、回滚验证、发布检查等工作，降低发布风险，提高交付效率。
3、负责应用运行状态监控与告警处理，建设和维护监控指标、日志采集、链路追踪、告警规则和运行报表，及时发现并推动解决系统异常。
4、负责操作系统、数据库、中间件等基础组件的部署、配置、监控和日常维护，包括Linux/Windows、MySQL/PostgreSQL/Redis、Nginx、Kafka、RabbitMQ、Elasticsearch 等常用组件的运维支持。
5、负责应用系统故障排查和应急处理，能够根据日志、监控、链路、资源使用情况等信息定位问题，配合研发、测试、网络、安全等团队完成故障恢复和复盘改进。
6、负责 Kubernetes 集群及容器化应用的日常运维工作，包括容器部署、资源配置、服务检查、Pod 异常处理、日志查看、扩缩容、应用升级和运行优化等。
7、负责自动化运维脚本和工具的编写与维护，围绕部署发布、巡检检查、日志分析、告警处理、备份恢复等场景提升运维效率。
8、参与系统高可用、容灾备份、安全加固和稳定性治理工作，配合完成备份策略、恢复演练、权限检查、漏洞整改、风险巡检和应急预案执行。
9、参与 AI 工具在运维场景中的应用落地，如智能告警分析、知识库问答、日志辅助分析、运维工单分类、故障处理建议等，提高运维响应效率。
10、负责运维文档和知识库建设，包括部署手册、操作手册、应急预案、巡检清单、故障案例、变更记录和问题复盘文档等。
能力要求：
1、本科及以上学历，计算机、软件工程、信息管理、网络工程等相关专业优先；具备3年以上应用运维、系统运维、平台运维或云原生运维相关经验。
2、熟悉 Linux/Windows 操作系统运维，掌握系统服务管理、文件系统、网络配置、权限管理、资源监控、日志分析和常见故障排查方法。
3、熟悉 Shell、Python 或 PowerShell 等脚本语言，能够编写常用自动化运维脚本，用于部署、巡检、备份、日志处理和批量操作等场景。
4、熟悉常用数据库和缓存组件的基础运维工作，如 MySQL、PostgreSQL、Redis、MongoDB 等，了解部署配置、备份恢复、主从复制、性能监控和常见问题处理。
5、熟悉常用中间件和基础服务组件的运维管理，如 Nginx、Kafka、RabbitMQ、Elasticsearch 等，能够完成配置调整、运行监控、日志排查和故障处理。
6、熟悉 Docker 和 Kubernetes 基础运维操作，能够完成容器化应用部署、服务检查、资源调整、日志查看、故障排查和应用升级；熟悉 Helm、Ingress、ConfigMap、Secret、PVC 等常用对象者优先。
7、熟悉 CI/CD、监控告警、日志分析、可观测性相关工具或平台，如 Jenkins、GitLab CI、Prometheus、Grafana、ELK、SkyWalking、Zabbix 等，有实际使用经验者优先。
8、具备较强的问题分析和故障排查能力，能够在高压场景下快速定位问题、组织处理、恢复业务，并参与故障复盘和改进。
9、具备良好的安全意识和规范意识，了解账号权限管理、漏洞整改、补丁升级、基线检查、备份恢复、访问控制等基础安全运维要求。
10、具备良好的沟通协作能力和服务意识，能够与研发、测试、网络、安全、业务等团队高效协作，推动问题闭环。
11、了解云平台或混合云环境运维，熟悉主流云厂商基础产品，如云主机、负载均衡、对象存储、云数据库、容器服务、云监控等，有实际运维经验者优先。
12、了解 AI 产品或大模型工具在运维场景中的使用方式，如智能问答、日志分析、告警归因、知识库检索、工单辅助处理等；有相关落地经验者优先。
13、具备相关认证者优先，如软考信息系统管理工程师、系统规划与管理师、网络工程师、信息安全工程师，或 CKA、CKAD、云厂商认证等。

月薪含绩效工资，考核发放；年终奖根据公司经营业绩及考核确定