更新于 10月28日

ai运维工程师

2-2.4万
  • 上海黄浦区
  • 3-5年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 人际关系好
  • 管理人性化
  • 氛围活跃
  • 交通便利
  • 团队执行强

职位描述

云计算/大数据
1、负责AI相关配套资源的运维和管理支持工作,与供应商对接问题,保证资源可用性。
2、负责公司 GPU 平台的可用性支持,问题答疑,保证任务的稳定性。
3、保障大模型服务的可用性,包括升级,部署,运维相关工作
4、推动 AI服务的高可用性建设,能持续发现问题并推动演进。
任职资格
1、熟悉 Linux/Kubernetes/Prometheus/Grafana的基本知识和操作;
2、熟悉 Shell/Python 两种语言,能够进行工具开发工作;
3、熟悉 GPU 基本知识,包括型号,算力,网络,有基础的排障能力;
4、熟悉主流云厂商的云服务与控制台操作;
4、对大语言模型服务的全链路有基本认知;
5、善于团队协作,具备良好的沟通能力和责任心;
加分项:
1、有 大语言模型/GPU运维经验;
2、有 MCP Server/Agent的开发经验

工作地点

上海黄浦区LuOne凯德晶萃广场(徐家汇路店)

职位发布者

鞠婧/人事

立即沟通
公司Logo博彦科技承德有限公司
博彦科技(深交所上市公司,股票代码002649)是一家面向全球的IT咨询、产品、解决方案与服务提供商。公司成立于1995年,总部位于中国北京,并在中国、美国、西班牙、日本、印度、新加坡和马来西亚等7个国家设有40余家分支机构、研发基地或交付中心。博彦科技依托自身强大的研发与创新能力,广泛采用基于物联网、大数据、人工智能和移动互联等新兴技术,为高科技、金融、互联网、地产、交通、汽车、零售、能源、制造、航空、电信、媒体、旅游等行业客户提供丰富的解决方案及产品。博彦科技遵循严格的质量和安全标准,实施严密的安全措施,拥有成熟可靠的管理和开发流程,并获得CMMI 3、ISO 20000、ISO 9001、ISO 27001、ISO 14001、OHSAS 18001等一系列资质认证。公司凭借多年的行业积累、深厚的行业专长和成熟的行业实践、国际化的精英团队和完善的人才管理、完备的全球化交付与服务网络、以及无处不在的创新精神与实践,助力全球客户尽享科技革新所带来的卓越运营,为客户持续创造关键价值。
公司主页