更新于 今天

驻场大模型运维工程师

1.4-2万
  • 上海 静安区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

ShellPython脚本开发3年以上LINUX
中国电信的外包岗位,介意勿扰!本科!
岗位内容
1、基础设施管理:负责用户现场虚拟机、Kubernetes集群及中间件资源的维护与管理,包括Linux操作系统与开源组件的部署、资源扩容、配置变更等日常运维操作。
2、平台发版与上线支持:负责业务平台在正式环境的版本发布评审与操作实施。
3、故障处理与恢复:快速响应系统及开源组件的异常事件,准确诊断问题根源,实施有效修复措施,最大限度减少服务中断时间,提升系统可用性。
4、算力资源管理:根据用户需求,完成算力资源的纳管与释放,确保资源可监控、可调度、可管理。
5、模型评测:对模型在不同算力设备上的运行表现进行模型性能、基准能力、行业能力的评估,输出评测数据,评估模型适配的硬件资源类型,支持模型部署决策。
6、模型部署支持:根据业务需求,完成模型的部署工作,包括资源配置建议、镜像打包、部署验证及性能指标跟踪。
7、模型运行监控:实时监控模型运行状态,包括准确性、响应时间、资源占用等关键指标;定期开展模型健康检查和性能拨测,识别瓶颈并推动优化改进。
职位要求:
1、计算机相关专业,大学本科或以上学历;
2、具备3年以上Linux运维工作,精通linux环境下的日常运维工具,并具备安装、配置及排障能力;
3、熟悉Docker\Kubernetes等生态圈项目,如容器集群、监控、日志、存储等部署方案;
4、熟练使用shell、python等语言进行运维工具或自动化脚本的编写;
5、优先考虑掌握NVIDIA系列卡的大模型部署,熟悉大模型在海光K100、华为910B等国产算力卡的应用部署;
6、优先考虑熟练使用至少一种主流Al训练框架,如TensorFlow、PyTorch、Caffe等;
7、具备较强的运维意识以及自我驱动和学习能力。

工作地点

工作地点
上海静安区武定路
位置图标
完善简历

公司信息

上海金亥数智科技有限公司

未融资 · 100-299人 · 通信/网络设备、通信/网络设备 已审核 已审核

20 个在招职位

公司介绍

上海金亥通信设备有限公司:致力于成为结合典型行业的数字化解决方案提供商,在智能网联、智慧消防、智慧园区等领域拥有成熟的解决方案以及众多的实施案例,同时借助优秀的人才资源和渠道优势,为客户提供定制化的技术服务、数字集成及信息化解决方案。

工商信息

企业名称 上海金亥数智科技有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 郭彪
经营状态 存续
成立时间 2015-05-25
注册资本 1000万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

179122-应用运维工程师

面议 深圳平安融易投资咨询有限公司
本科 3-5年 各类活动 五险一金 补充医疗保险 带薪年假 定期体检 高温补贴 节日福利

综合运维管理岗

6000-12000元 浙江金诺通科技有限公司
大专 系统运维 通信运营商/电信增值服务 通信/网络设备

系统运维工程师

1-2万 上海嘉事明伦医疗器材有限公司
本科 系统运维 网络运维 云运维 软件/IT服务

客服运维

8000-9000元 软通动力信息技术(集团)股份有限公司
本科 1-3年 系统运维 云运维 Docker 云计算

运维工程师

7000-14000元 上海晶酶生工智能科技有限公司
本科 1-3年 工业自动化/机器人 化工

PLM运维经理

1.3-2万·13薪 上海坤德信息科技有限公司
大专 5-10年 系统运维 PLM 计算机软件

运维工程师(电网/电力)

7000-11000元 南京绛门信息科技有限公司
本科 3-5年 系统运维 网络运维 Docker Python Shell 电力/水利/热力/燃气
最新招聘
热门城市
热门职位
热门公司