一、岗位职责:
1、负责 Linux/Windows Server 系统的安装、配置、性能调优及日常运维,保障服务器稳定高效运行;
2、搭建并维护开发、测试、生产环境,支持高并发网站及大流量业务系统的稳定运行;
3、部署、监控与优化主流中间件及服务,包括 Nginx、MySQL、Redis、ZooKeeper、ELK、RocketMQ、Nacos 等;
4、对 Java 应用进行 JVM 监控、性能分析与参数调优,定位内存泄漏、GC 异常、线程阻塞等运行时问题;
5、编写 Shell/Python 自动化脚本,提升部署、监控、故障处理等运维效率;
6、实施系统级监控、日志分析与故障快速定位,完善应急预案与复盘机制;
7、参与 CI/CD 流水线(如 Jenkins)维护,支持应用快速发布与回滚;
8、管理云上资源(阿里云/腾讯云等),配合网络、安全策略(防火墙、CDN、DNS)实施基础设施安全加固;
9、编写和维护相关技术文档,协同研发团队高效解决线上问题。
二、任职要求:
1、本科及以上学历,计算机或相关专业,3年以上系统运维工作经验;
2、精通 Linux 系统管理,熟悉 Windows Server 常用服务(如 AD、文件共享等);
3、熟练掌握 Shell/Python 脚本开发,具备自动化运维工具开发能力;
4、具备高并发网站或大流量业务系统的实际运维经验,熟悉负载均衡、缓存、读写分离等高可用架构;
5、熟悉主流中间件(Nginx、MySQL、Redis、ELK、RocketMQ 等)的部署、调优与故障排查;
6、掌握 TCP/IP、DNS、CDN 等网络基础知识,了解云平台(阿里云/腾讯云)基础服务;
7、具备良好的沟通能力、责任心强,能独立承担运维任务并快速响应线上问题;
三、加分项:
1、有 Hadoop、HBase、Spark、Flink、Elasticsearch 等大数据组件运维经验;
2、持有 RHCE、云厂商认证(如阿里云 ACA/ACP)、DBA 或 Linux 相关证书;
3、参与过 Prometheus + Grafana 等监控告警体系建设。