核心技术能力:
·核心技术能力:
1、熟练掌握 Kubernetes 在生产环境中的部署、运维与排障。
2、丰富的 CI/CD 流水线(如 Jenkins)设计与维护经验。
3、必须阿里云熟悉,AWS加分;要求有SRE经验,偏应用。
4、理解网络协议,具备 HTTP 等常见协议层面的问题诊断能力。
5、熟悉Linux系统、常用中间件及分布式系统架构。
6、编程与自动化经验:熟练掌握 Python 或 Go 语言者将获得优先考虑。
7、拥有高并发、高可用性系统的维护经验,有电商或类似ToC业务系统运维经验者将更具优势。
核心职责:
1. 系统可靠性与性能守护:负责基于 Kubernetes (k8s) 的容器化生产环境以及CI/CD流水线(使用 Jenkins 等工具)的稳定性、可用性与性能优化。您需要主动发现潜在风险,并推动解决。
2. 全链路监控与反馈机制建设:设计与完善系统监控、告警及日志体系,确保对各类服务(特别是 HTTP 请求链路)的状态有清晰的可见性,并能建立有效的反馈闭环,及时同步信息,保障团队及相关方能快速响应。
3. 自动化与效率提升:通过编写自动化脚本与工具(如使用 Python/Go),消除重复性运维工作,提升故障响应与处理效率,体现您对工作成果持续改进的追求。
4. 跨团队协作与项目推动:需要与开发、测试及产品团队紧密协作。主动沟通项目进度、透明化风险,共同制定并执行容量规划、故障复盘与应急预案,确保项目顺利交付。