更新于 今天

大模型异构训练推理研发工程师

2-4万
  • 北京 西城区
  • 5-10年
  • 本科
  • 全职

职位描述

电力/水利/热力/燃气
工作内容
1. 统筹阿里云 AI Studio与华为云 ModelArts的算力资源接入、模型纳管及混合云部署架构设计,实现异构算力统一调度。设计适配异构模型推理加速、资源监控等能力调用。
2. 结合SOTA模型训练推理优化原理,深入研究模型结构与设计思路,将训练推理优化手段进行工程实践化,为客户提供系统性加速方案,有效提升模型训推效率。
3. 在自研芯片上适配各类常见大模型,结合深度学习训推框架特性,开发并调优相关算子,提升模型在自研芯片上的运行性能与精度表现,同时辅助客户完成芯片选型与落地应用工作。
4. 针对大规模异构集群业务场景,探索训推任务管理、异构资源调度、分布式训练与推理等核心技术的创新落地与场景化应用。
5. 持续跟踪AI行业前沿技术发展,深度参与LLM、强化学习、Agent等开源社区建设,助力提升百度混合云AI体系核心竞争力。
岗位需求
1. 本科及以上学历,具备扎实的计算机相关专业知识背景。
2. 拥有优秀的编码能力,熟练掌握Golang、Python、Java、C、C++至少一门编程语言,具备扎实的算法与数据结构基础,拥有规范、良好的编程习惯。
3. 熟悉PyTorch深度学习框架,了解Megatron、DeepSpeed、vLLM、SGLang等主流大模型训推框架,具备相关框架二次开发实战经验。
4. 具备以下至少一个领域深度实践经验者优先:
(1)推理优化:熟练掌握FlashAttention、PD分离、专家并行、负载均衡、模型压缩(蒸馏/量化)、缓存策略、异构计算加速等技术;
(2)训练优化:精通分布式训练、显存优化(ZeRO/Offload)、计算通信Overlap、混合精度训练、MoE架构调优等技术;
(3)深入理解GPU/NPU芯片架构,熟悉CUDA、OpenCL等高性能计算编程,拥有千亿参数级别大规模模型训练或推理实战经验;
(4)拥有开源项目贡献经验,在相关技术社区具备一定行业影响力。
5. 熟悉电力行业业务,具备电力行业相关项目落地背景者优先。
6. 具备独立的问题分析与攻坚解决能力,拥有极强的责任心、自主学习能力与跨团队沟通协作能力。
7. 具备强烈的责任心与自驱力,可在复杂项目环境中高效推进项目落地,能够快速迭代掌握前沿新技术,适配团队协同工作节奏。
8. 能够接受长期异地出差。

工作地点

工作地点
西城区北京昌盛
位置图标
完善简历

公司信息

江苏上古科技有限公司

未融资 · 100-299人 · 软件/IT服务 已审核 已审核

10 个在招职位

公司介绍

司主要提供包括电力、水利水电行业产品研发、电子商务网站建设、管理信息系统、应用软件及移动APP软件的开发与后期技术支持服务,秉着平台即服务(laas)、软件即服务(saas)的宗旨,面向社会各行业提供定制信息化服务,提供优质的信息化解决方案。 汇聚了全国各地优秀的软件、系统集成技术方面的精英人才以及多个行业领域的专家和各类创新型人才,构成了一支具有非凡竞争力的研发团队,具有领先的经营理念、广泛的合作策略、出色的技术能力、精益求精的服务理念。致力于为国内外合作伙伴提供快速响应市场和业务需求的软件开发与测试服务,拥有10年以上业内资历的高级管理层以及一支高效率的技术团队,能承接多种行业需求的项目开发。

工商信息

企业名称 江苏上古科技有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 汤仕磊
经营状态 存续
成立时间 2015-08-14
注册资本 1100万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

算法工程师

2.2-2.8万 上海微创软件股份有限公司
本科 3-5年 深度学习 机器学习 强化学习  Python C++ 产业互联网平台 物联网

医学领域大模型研究应用工程师

150-200元/天 首都医学科学创新中心
本科 深度学习 大模型算法 PyTorch Python 计算机软件 云计算

AI应用开发工程师

1.2-2万 中标合信(北京)认证有限公司
本科 3-5年 人工智能 检测/认证/计量 云计算

Agentic AI 研究员/研究助理

8000-15000元 西藏德众地理信息有限公司北京分公司
1-3年 深度学习 大模型算法 强化学习  PPO TRPO A3C GPT 生成式大模型 LLAMA Transformer Attention GNN 自然语言处理 导航算法 地理信息处理 PyTorch Python C++ 人工智能 船舶/航空/航天/军工 学术/科研

AI Agent开发工程师

1.5-2.5万 爱多邦(北京)信息技术服务有限公司
本科 5-10年 图像算法 大模型算法 语音识别 WaveNet RNN-T LAS GPT RoBERTa XLNet GoogLeNet AlexNet LeNet-5 搜索/推荐算法 知识图谱 通信算法 PyTorch TensorFlow OpenCV Python SKILL定制开发 LLM/AGENT开发 AGENT架构/API设计 半导体/芯片 工业自动化/机器人 物联网

算法工程师ys

1.5-2.5万 中国人民解放军32806部队
硕士 1-3年 TensorFlow PyTorch Python C++ 人工智能

人工智能专家

3-5万 北京新联铁集团股份有限公司
硕士 5-10年 图像算法 多模态算法 大模型算法 机器视觉 人工智能

ai应用工程师

1.5-2万·13薪 北京卓识网安技术股份有限公司
本科 1-3年 深度学习 图像算法 多模态算法 自然语言处理 搜索/推荐算法 C语言 C++ 云计算 信息安全 人工智能
最新招聘
热门城市
热门职位
热门公司