更新于 10月24日

工程技术岗/研究岗(大模型算法)(J10378)

2.5-4.5万
  • 北京海淀区
  • 经验不限
  • 硕士
  • 全职
  • 招5人

职位描述

深度学习机器学习
岗位职责:
1. 面向人工智能、科学计算与大数据处理融合的智能体系结构,开展大规模预训练模型相关研究。包括但不限于数据清洗、算法设计、训练推理、模型压缩等研究方向。
2. 与团队成员协同工作,设计实现各种模块或功能,并进行性能调优;解决大规模预训练模型研发过程中遇到的算法问题,如进行模型评测、缓解模型幻觉等。
3. 探索创新:积极探索新方法、不断提升工作效率及团队协调开发能力。
任职要求:
1.硕士及以上学历,计算机科学与技术专业优先, 计算机/人工智能/大数据/知识工程/电子信息/通信等相关专业优先。
2.良好的编程风格与文档撰写能力,有多人协作开发及 Code Review 经验,对代码有严格的质量要求;熟悉常见开发规范,熟悉git等开发工具,熟悉代码库的创建与维护操作。
3.掌握深度学习基础知识,至少熟悉一种深度学习编程框架,如PyTorch、Tensorflow、Paddle、MindSpore等,有模型开发、部署、微调经验。
4. 对Transformer、深度学习有一定深度的理解和经验,能根据论文复现相关算法,有大规模预训练模型研发和训练经验者优先;高质量相关论文ACL,EMNLP,COLING,NAACL作者优先。

工作地点

北京海淀区启元实验室(东区)

职位发布者

李先生/人力资源主管

立即沟通
公司Logo启元实验室
启元实验室,成立于 2020年10月,是智能科技领域的新型科研事业单位,位于中关村国家创新自主示范区核心区(海淀园)。实验室聚焦智能科技领域原始创新,汇聚国内外一流科技人才,依托国际一流的大型科研基础设施,主要开展智能领域的基础理论研究、核心关键技术攻关、应用研究与开发,勇闯智能科技“无人区”,打造世界一流的智能科技创新战略力量。
公司主页