1.熟悉inux、windows等操作系统,有系统底层调优经验。
2.利用批量部署工具(如 Ansible)实现服务器、中间件的自动化部署。
3.负责 Docker 容器与 K8s 集群的搭建、管理及故障排查。
4.通过开源监控工具(如 Prometheus、grafana)监控系统指标,及时处理异常。
5.排查 Linux、中间件、容器及 AI 工具的运行故障并优化性能。
6.进行系统安全加固、漏洞修复,确保合规性。
7.跟踪开源技术动态,推动新技术(如 AI 工具)落地与团队分享。
职责:
1.本科及以上学历,计算机相关专业,5 年以上 Linux 系统运维经验。
2.精通 Linux 系统(CentOS/Ubuntu)配置、调优及命令行操作。
3.熟悉开源中间件(Nginx/Redis/Kafka 等)的部署与优化。
4.掌握 Docker 镜像构建、K8s 集群管理及核心资源配置。
5.熟练使用至少一种开源监控工具(Prometheus/Zabbix)和批量部署工具。
6.了解 AI 开源工具(TensorFlow/PyTorch)的基本架构及环境搭建。
7.具备强故障排查能力、学习能力及团队协作精神。