该职位已失效,看看其他机会吧

大模型应用工程师

3-6万
  • 北京石景山区
  • 3-5年
  • 硕士
  • 全职
  • 招2人

职位描述

PyTorchTransformerPythonLLMLoRaP-TUNINGRLHF人工智能
1. 硕士及以上学历,计算机科学、人工智能、数学、数据科学或相关专业背景。
2. 具备扎实的机器学习与深度学习理论基础,熟悉 Transformer 架构、注意力机制和预训练范式。
3. 至少 2 年以上大规模模型研发经验,熟悉 PyTorch、DeepSpeed、Megatron-LM、vLLM 等主流训练/推理框架。
4. 具备大规模分布式训练调优经验,能够独立设计高效的分布式训练策略,解决 GPU 集群资源利用与性能瓶颈问题。
5. 熟练掌握至少一种大语言模型微调技术(LoRA、P-Tuning、RLHF、DPO 等),有实际落地案例。
6. 具备将复杂业务需求抽象为模型问题并提出创新性解决方案的能力。
1、大模型研发与优化:负责预训练语言模型的研发与优化,包括参数规模在百亿级以上的 Transformer 类模型;探索混合专家(MoE)、长上下文(Long-Context)、稀疏注意力等前沿架构提升推理与训练效率。
2、模型训练与微调:针对不同业务场景,开展大规模语料预训练、指令微调(Instruction Tuning)、偏好对齐(RLHF、DPO 等)和低成本高效微调(LoRA、QLoRA、P-Tuning 等),提高模型在垂直领域的表现。
3、性能与部署优化:研究并实现分布式训练(如 ZeRO、FSDP、DeepSpeed、Megatron-LM)、模型并行与推理加速(vLLM、TensorRT-LLM、FlashAttention),降低 GPU 内存消耗与推理时延。
4、工程落地:与平台团队协作,提供模型推理服务 API,封装高性能 SDK,支持多端调用(Web/移动端);负责大模型在知识图谱、搜索推荐、对话系统等场景的落地与优化。
5、前沿探索:跟踪 LLM、Multimodal、RAG(检索增强生成)、Agent 框架以及模型安全性(安全对齐、防幻觉)领域的最新进展,推动大模型与知识图谱、图神经网络等技术结合。
查看全部

工作地点

中国电科智能科技园北京石景山区中国电科智能科技园

入职公司信息

  • 入职公司: 某餐饮公司
  • 公司地址: 西安雁塔区
  • 公司人数: 1000-9999人

认证资质

营业执照信息 人力资源服务许可认证

职位发布者

刘宏昕/人事经理

三日内活跃
立即沟通
公司Logo科锐尔人力资源服务(苏州)有限公司公司标签
科锐国际人力资源有限公司成立于1996年,总部位于北京。作为亚洲领先的整体人才解决方案服务商,科锐国际在中国大陆、香港、印度、新加坡等亚洲地区拥有超过79家分支机构,1,500余名专业招聘顾问,在超过18个行业及领域为客户提供中高端猎头、招聘流程外包、灵活用工、营销外包、校园招聘、培训、招聘咨询等解决方案。截至目前,科锐已与2,000余家跨国集团、国内上市公司、快速成长性企业及非盈利组织建立长期合作关系。其中70%为外资500强企业。
公司主页