职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 围绕Kubernetes生态参与建设大规模异构集群,包括调度、Operator、存储、网络、节点端优化等方面的内容;
2. 围绕YARN生态,不断提升大规模YARN集群的扩展性、稳定性。
3. 建设日志、监控、指标等观测体系,提升系统的可观测能力。
4. 协同上下游持续提升稳定性和系统能力。
岗位基本需求
1)熟练使用至少一门编程语言,如Java或Golang;
2)深入理解YARN架构 或 Kubernetes生态,能够熟练二次开发。
3)熟悉容器技术(如Docker,containerd),并有实际的开发或调优经验。
3)计算机基础知识扎实,具备良好的问题分析和解决能力,有团队合作精神和沟通能力;
具备以下者优先
1)具备大规模集群管理和资源调度的实践经验者优先;
2)具有扎实的操作系统知识和经验者。
3)具有开源项目贡献经验或技术社区活跃成员。
岗位亮点
1)资源规模大、场景问题复杂和技术挑战大,在这里你可以深耕技术,做出业界先进的成果,晋升空间大;
2)管理数万台CPU/GPU服务器,承载美团所有的机器学习和大数据任务;
3)在核心团队和领域专家一起工作,团队风格严谨务实,学习氛围浓厚,成长环境好。