更新于 5月21日

算法工程师(大模型训练方向)

1.5-2.5万
  • 上海 闵行区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

大模型算法新能源/燃油整车研发制造人工智能
主要职责:
职位描述: 负责车载场景下大语言模型(LLM)及多模态大模型的从头训练(Pre-training)、微调(Fine-tuning)与对齐(Alignment)工作。理想的候选人需具备深厚的深度学习底层框架功底,拥有大规模 GPU 集群分布式训练的实战经验,能够主导车载垂直领域基座模型的能力建设与量产落地。
具体职责:
1.模型训练与迭代: 负责主流大模型(及多模态模型)的预训练(Pre-training)、全参数微调(SFT)以及基于人类反馈的强化学习/直接偏好对齐(RLHF/DPO)等核心训练任务。
2.分布式训练优化: 搭建与维护大规模分布式训练框架,深入解决海量参数模型在训练过程中的显存瓶颈、通信开销问题,提升算力集群的训练吞吐量(MFU)。
3.高质量数据工程: 主导构建训练数据流水线,包括海量通用预训练语料与车载垂直领域数据的清洗、去重、质量过滤以及合成数据的生成。
4.模型评测与诊断: 建立和完善多维度的模型能力评测体系,针对智能座舱等特定场景构建自动化评测基准;分析训练 Loss 曲线,快速定位并解决梯度爆炸、Loss 发散、OOM 等疑难杂症。
5.前瞻技术演进: 密切追踪前沿的模型架构(如 MoE 架构、长上下文处理机制)及训练加速算法,并推动其在实际工程和量产交付中的落地。
岗位要求
教育背景:
本科及以上学历,计算机科学、人工智能、数学或相关专业。
工作经验:
5 年以上大模型底层训练及优化实战经验。
技术/专业技能:
底层算法功底: 深刻理解 Transformer 底层架构及各种变体原理,熟悉主流开源模型(如 Qwen, Llama 等)的代码实现细节。
分布式训练框架: 熟练掌握 PyTorch,熟练使用 ms-swift (ModelScope)、LLaMA-Factory 等高效微调与训练生态框架。
并行计算技术: 深入理解并能熟练应用数据并行(DP)、张量并行(TP)、流水线并行(PP)、序列并行(SP)以及 ZeRO 系列显存优化技术。
训练全链路能力: 具备完整的模型对齐经验(SFT, RM, PPO/DPO),熟悉高质量指令集构建方法及 Tokenization 原理。
工程与编程: 具备极强的 Python 编程能力,熟悉 CUDA 编程及 GPU 算子优化者优先。
问题排查能力: 具备优秀的工程 debug 能力,能够独立解决复杂分布式环境下的软硬件协同问题。
加分项(优先考虑):
多模态训练: 具备视觉-语言模型(VLM)或语音-大语言模型(Audio-LLM)的联合训练经验。
平台适配: 了解模型量化、剪枝技术,有在下一代高性能自动驾驶/智能座舱计算平台上的端侧部署与适配经验。
个人素质:
对前沿 AI 技术有极强的热情与技术信仰。
具备极强的逻辑思维能力,能在高压环境下保持技术敏锐度。
优秀的团队协作能力,能与底层算力平台团队及上层应用团队无缝对接。

工作地点

工作地点
上海闵行区虹桥汇西区-T3号楼
位置图标
完善简历

公司信息

长春风火轮科技有限公司

未融资 · 100-299人 · 人工智能、产业互联网平台、软件/IT服务、计算机硬件 已审核 已审核

49 个在招职位

公司介绍

公司成立于2016年,立足于软硬一体的人工智能技术,专注工业、金融、教育领域的AI解决方案。业务涵盖 AI+工业仿真、AI+具身安防机器人、AI+工业物联网、AI+数据治理、金融风控模型等领域。获得ISO9001、IS27001双认证、同时获得高新技术企业、科技型中小企业、市专精特新企业、瞪羚企业称号。 依托强大的AI数据治理能力,打造“个性化场景 + 专家模型 + 硬件设备”架构,公司构建“感知—决策—治理”闭环,实现从数据驱动的决策机制,持续推动传统工业或数字化企业向智能化转型。

工商信息

企业名称 长春风火轮科技有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 李旭
经营状态 存续
成立时间 2016-05-23
注册资本 2068.89万元
查看全部信息

认证资质

营业执照信息

相似职位

查看更多

人工智能工程师

1.5-2.5万·14薪 上海海诚工程管理有限公司
本科 1-3年 大模型算法 深度学习 RAG 人工智能 计算机软件

具身智能算法工程师

2.5-4万·14薪 上海追知工程科技有限公司
本科 3-5年 深度学习 机器学习 图像算法 ViT CLIP 工业自动化/机器人 电气机械/电力设备

感知算法高级设计师

1.2-1.6万 中国电子科技集团公司第二十一研究所
硕士 3-5年 图像算法 机器视觉 智能驾驶 导航算法 PyTorch TensorFlow OpenCV Python C++

vla算法工程师

3-6万·15薪 青岛汇程通工贸有限公司
本科 强化学习  多模态算法 大模型算法 人工智能

资深AI大模型算法工程师

1.8-3万 上海森辉耀热能有限公司
本科 5-10年 大语言模型 AI算法 AI软件开发

MPC算法开发工程师

1.8-3.5万 上海万澄环保科技有限公司
本科 3-5年 深度学习 机器学习 大模型算法 工业自动化/机器人 计算机软件 电气机械/电力设备

信号处理工程师

1.5-2.5万 上海传慎医疗器材有限公司
硕士 超声信号 医疗设备/器械/耗材

算法(Agent开发方向,base佛山)

1.5-1.9万 深圳建广数字科技有限公司青岛分公司
本科 1-3年 深度学习 Transformer 机器视觉 Python PyTorch AGENT 统本 人工智能
最新招聘
热门城市
热门职位
热门公司