职位描述
大模型算法新能源/燃油整车研发制造人工智能
主要职责:
职位描述: 负责车载场景下大语言模型(LLM)及多模态大模型的从头训练(Pre-training)、微调(Fine-tuning)与对齐(Alignment)工作。理想的候选人需具备深厚的深度学习底层框架功底,拥有大规模 GPU 集群分布式训练的实战经验,能够主导车载垂直领域基座模型的能力建设与量产落地。
具体职责:
1.模型训练与迭代: 负责主流大模型(及多模态模型)的预训练(Pre-training)、全参数微调(SFT)以及基于人类反馈的强化学习/直接偏好对齐(RLHF/DPO)等核心训练任务。
2.分布式训练优化: 搭建与维护大规模分布式训练框架,深入解决海量参数模型在训练过程中的显存瓶颈、通信开销问题,提升算力集群的训练吞吐量(MFU)。
3.高质量数据工程: 主导构建训练数据流水线,包括海量通用预训练语料与车载垂直领域数据的清洗、去重、质量过滤以及合成数据的生成。
4.模型评测与诊断: 建立和完善多维度的模型能力评测体系,针对智能座舱等特定场景构建自动化评测基准;分析训练 Loss 曲线,快速定位并解决梯度爆炸、Loss 发散、OOM 等疑难杂症。
5.前瞻技术演进: 密切追踪前沿的模型架构(如 MoE 架构、长上下文处理机制)及训练加速算法,并推动其在实际工程和量产交付中的落地。
职位描述: 负责车载场景下大语言模型(LLM)及多模态大模型的从头训练(Pre-training)、微调(Fine-tuning)与对齐(Alignment)工作。理想的候选人需具备深厚的深度学习底层框架功底,拥有大规模 GPU 集群分布式训练的实战经验,能够主导车载垂直领域基座模型的能力建设与量产落地。
具体职责:
1.模型训练与迭代: 负责主流大模型(及多模态模型)的预训练(Pre-training)、全参数微调(SFT)以及基于人类反馈的强化学习/直接偏好对齐(RLHF/DPO)等核心训练任务。
2.分布式训练优化: 搭建与维护大规模分布式训练框架,深入解决海量参数模型在训练过程中的显存瓶颈、通信开销问题,提升算力集群的训练吞吐量(MFU)。
3.高质量数据工程: 主导构建训练数据流水线,包括海量通用预训练语料与车载垂直领域数据的清洗、去重、质量过滤以及合成数据的生成。
4.模型评测与诊断: 建立和完善多维度的模型能力评测体系,针对智能座舱等特定场景构建自动化评测基准;分析训练 Loss 曲线,快速定位并解决梯度爆炸、Loss 发散、OOM 等疑难杂症。
5.前瞻技术演进: 密切追踪前沿的模型架构(如 MoE 架构、长上下文处理机制)及训练加速算法,并推动其在实际工程和量产交付中的落地。
岗位要求
教育背景:
本科及以上学历,计算机科学、人工智能、数学或相关专业。
工作经验:
5 年以上大模型底层训练及优化实战经验。
技术/专业技能:
底层算法功底: 深刻理解 Transformer 底层架构及各种变体原理,熟悉主流开源模型(如 Qwen, Llama 等)的代码实现细节。
分布式训练框架: 熟练掌握 PyTorch,熟练使用 ms-swift (ModelScope)、LLaMA-Factory 等高效微调与训练生态框架。
并行计算技术: 深入理解并能熟练应用数据并行(DP)、张量并行(TP)、流水线并行(PP)、序列并行(SP)以及 ZeRO 系列显存优化技术。
训练全链路能力: 具备完整的模型对齐经验(SFT, RM, PPO/DPO),熟悉高质量指令集构建方法及 Tokenization 原理。
工程与编程: 具备极强的 Python 编程能力,熟悉 CUDA 编程及 GPU 算子优化者优先。
问题排查能力: 具备优秀的工程 debug 能力,能够独立解决复杂分布式环境下的软硬件协同问题。
加分项(优先考虑):
多模态训练: 具备视觉-语言模型(VLM)或语音-大语言模型(Audio-LLM)的联合训练经验。
平台适配: 了解模型量化、剪枝技术,有在下一代高性能自动驾驶/智能座舱计算平台上的端侧部署与适配经验。
个人素质:
对前沿 AI 技术有极强的热情与技术信仰。
具备极强的逻辑思维能力,能在高压环境下保持技术敏锐度。
优秀的团队协作能力,能与底层算力平台团队及上层应用团队无缝对接。
教育背景:
本科及以上学历,计算机科学、人工智能、数学或相关专业。
工作经验:
5 年以上大模型底层训练及优化实战经验。
技术/专业技能:
底层算法功底: 深刻理解 Transformer 底层架构及各种变体原理,熟悉主流开源模型(如 Qwen, Llama 等)的代码实现细节。
分布式训练框架: 熟练掌握 PyTorch,熟练使用 ms-swift (ModelScope)、LLaMA-Factory 等高效微调与训练生态框架。
并行计算技术: 深入理解并能熟练应用数据并行(DP)、张量并行(TP)、流水线并行(PP)、序列并行(SP)以及 ZeRO 系列显存优化技术。
训练全链路能力: 具备完整的模型对齐经验(SFT, RM, PPO/DPO),熟悉高质量指令集构建方法及 Tokenization 原理。
工程与编程: 具备极强的 Python 编程能力,熟悉 CUDA 编程及 GPU 算子优化者优先。
问题排查能力: 具备优秀的工程 debug 能力,能够独立解决复杂分布式环境下的软硬件协同问题。
加分项(优先考虑):
多模态训练: 具备视觉-语言模型(VLM)或语音-大语言模型(Audio-LLM)的联合训练经验。
平台适配: 了解模型量化、剪枝技术,有在下一代高性能自动驾驶/智能座舱计算平台上的端侧部署与适配经验。
个人素质:
对前沿 AI 技术有极强的热情与技术信仰。
具备极强的逻辑思维能力,能在高压环境下保持技术敏锐度。
优秀的团队协作能力,能与底层算力平台团队及上层应用团队无缝对接。
工作地点
上海闵行区虹桥汇西区-T3号楼

公司信息
公司介绍
公司成立于2016年,立足于软硬一体的人工智能技术,专注工业、金融、教育领域的AI解决方案。业务涵盖 AI+工业仿真、AI+具身安防机器人、AI+工业物联网、AI+数据治理、金融风控模型等领域。获得ISO9001、IS27001双认证、同时获得高新技术企业、科技型中小企业、市专精特新企业、瞪羚企业称号。 依托强大的AI数据治理能力,打造“个性化场景 + 专家模型 + 硬件设备”架构,公司构建“感知—决策—治理”闭环,实现从数据驱动的决策机制,持续推动传统工业或数字化企业向智能化转型。
工商信息
企业名称 长春风火轮科技有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 李旭
经营状态 存续
成立时间 2016-05-23
注册资本 2068.89万元
认证资质
营业执照信息

更新于 5月21日





