该职位已失效,看看其他机会吧

大模型算法工程师

3-4万
  • 北京西城区
  • 5-10年
  • 硕士
  • 全职
  • 招1人

职位描述

语言模型多模态模型AI项目人脸识别活体检测BTA大厂人工智能
1. 大模型优化算法的研究与设计:负责研究大模型领域(语言模型、多模态模型等)的优化算法、网络结构优化及改进设计、大模型蒸馏训练,以及预训练研发任务等。
2. 垂类领域大模型研发与调优:负责针对专业领域场景和数据,利用增量训练、微调训练、知识增强、超参数调整等技术训练垂类领域大模型,提升模型性能,并维护线上模型的稳定性,实现AI项目落地与交付。
3. AI产品相关的模型研发与维护:负责公司AI能力或产品对应的模型研发、迭代与维护,包括小模型及大模型的设计、训练研发及优化,确保模型效果与业务需求匹配。
4. 大模型国产化性能优化与适配:适配昇腾等国产硬件平台,优化模型算子性能及分布式训练策。
5. 技术探索与创新:跟踪大预言模型、多模态大模型的预训练、大模型方向的最新成果,探索其在业务中的应用价值。
任职要求
1. 教育背景与工作经验:计算机及相关专业本科及以上学历,具备五年以上相关工作经验。参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等。
2. 精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
3. 熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;
4. 熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;
5. 熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
6. 熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;
查看全部

工作地点

北京西城区金融大街1

职位发布者

耿女士/人事经理

立即沟通
公司Logo晴亿清晖(哈尔滨)信息服务有限公司
销售推广……………………………………和客户维护…………………………………及客户服务…………………………………业务支持全国…………………………………………………………………………………………..
公司主页