更新于 7月22日

Ai大模型工程师

12-20万
  • 北京朝阳区
  • 3-5年
  • 硕士
  • 全职
  • 招1人

职位描述

大模型算法GPTPyTorch搜索/推荐算法Python人工智能
岗位职责:
前沿算法研究与技术创新:负责人工智能领域前沿算法研究和创新,重点聚焦LLM、生成式AI、时序类大模型等,探索人类反馈强化学习、MoE、多模态、long-context等方向。
模型微调与优化:负责对大语言模型(LLM)进行领域适配微调(如LoRA、P-Tuning等),提升模型在特定任务(如对话、文本生成等)上的性能。
数据处理与构建:清洗、标注和构建高质量的微调数据集,设计数据增强策略以提升模型泛化能力。
实验设计与调参:设计微调实验方案,调整超参数(学习率、批次大小等),评估模型效果并迭代优化。
性能评估与监控:使用BLEU、ROUGE等指标评估模型输出,分析bad case并提出改进方案。
模型对齐:优化强化学习与对齐训练流程,解决大规模分布式环境下的效率瓶颈和行业对齐。
工程化部署支持:协助将微调后的模型部署到生产环境,优化推理效率(如量化、剪枝)。
技术跟踪与创新:跟进大模型领域最新技术(如RLHF、Adapter架构),探索低成本微调方案。
任职要求:
技术背景:计算机、AI相关专业硕士及以上学历,熟悉PyTorch/TensorFlow框架和Transformer架构。
微调经验:有LLM(如GPT、LLaMA、ChatGLM)微调实战经验,熟悉Prompt Engineering和Few-shot Learning。
数据处理能力:熟练使用NLP工具(Hugging Face、spaCy),具备文本清洗、标注和分布式训练经验。
编程基础:精通Python,熟悉Linux环境,能优化训练代码(如混合精度训练、分布式训练)。
工程方向:精通分布式、微服架构思想,具有创建生产工程的相关经验。
问题解决能力:能分析模型欠拟合/过拟合问题,提出数据或算法层面的解决方案。
团队协作:良好的沟通能力,能与算法、产品团队协作落地业务场景需求。

工作地点

北京朝阳区长新大厦408

职位发布者

张子晔/HR

立即沟通
公司Logo书生电子
北京书生电子技术有限公司是启明星辰集团旗下全资子公司,以下简称书生公司。书生公司自1998年创立以来,一直致力于以数字技术取代传统纸张应用,提供有关产品技术和服务。书生公司在此领域掌握核心技术,具有全球竞争力,是中国极少数掌握产业核心技术的软件公司之一。除SEP技术外,书生公司还在电子印章、信息安全DRM、打印防伪、电子表单、数据采集与交换等方面拥有独特技术。书生公司一直秉承着让信息脱离纸张束缚的理念来发展和壮大。公司拥有全球领先的核心技术:在2008年10月,由书生公司倡导的UOML标准成为了全球唯一的文档操作标准,代表中国奠定了中国软件业在国际上的地位。书生公司始终把自主创新作为公司发展的核心竞争力,并在自主创新和国际化方面取得了重大进展。2014年,书生公司的文档存储产品(SurMD)通过美国HIPAA(医疗电子交换法案)医疗安全认证,已经被FDA(美国食品及药品管理局)批准为,成为可以进入美国医疗市场的医疗设备(注册号 3010831822)。书生公司一直追求“用起来、用得好、用得值”的应用效果。在电子公文、电子签章、文档服务器、文档数字化、办公套件、云存储、云计算、数字出版、数字图书馆、申报审批、数字书市、影像存储、电子图书交换、档案管理等领域拥有领先的解决方案,赢得了用户的信任。公司业绩连年高速增长,被《财富》杂志评为中国未来最值得关注的公司之一。书生已累计申请中国、美国、欧洲、日本专利142余项,绝大部分都是发明专利。其中美国、欧洲、日本国际PCT专利70余项。文档处理系统专利获中国专利优秀奖。公司拥有国家密码管理局颁发的商用密码定点生产和销售资质;国家保密局颁发的涉密计算机信息系统集成资质(适用地域:全国)。
公司主页