更新于 3月28日

多模态行业基模型训练

5-8万·14薪
  • 北京海淀区
  • 3-5年
  • 硕士
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 团队执行强
  • 人际关系好
  • 氛围活跃
  • 交通便利
  • 实力大公司
  • 五险一金

职位描述

机器视觉自然语言处理人工神经网络Transformer人工智能云计算/大数据
一、岗位职责:
1、负责多模态大模型的研发与优化工作,包括但不限于跨模态信息对齐方法探索、预训练、指令微调、RLHF等技术的研究与应用;
2、负责大规模多模态数据的获取、清洗及质量控制,保障数据质量和有效性;
3、跟进业界前沿,参与多模态大模型的设计、预训练、微调、评测全流程优化工作,构建业界的多模态大模型;
4、解决项目过程中的难题,推动多模态大模型商业化落地,提升系统效果和用户满意度。
二、任职要求:
1、硕士及以上,计算机科学、机器学习、人工智能、统计等相关专业优先;
2、在计算机视觉、多模态理解方面有扎实的研究基础,熟悉主流的多模态大模型,如Flamingo, InstructBLIP, LLaVA, Qwen-VL等,有相关实操经验者优先;
3、熟练掌握Python/C++等编程语言,熟悉机器学习基本理论和常用算法,具有较好的数据结构和算法分析能力;
4、熟悉Linux操作系统,熟练使用Pytorch、TensorFlow等深度学习框架,了解分布式训练框架如Deepspeed、Megatron-LM等,具备优秀的工程开发能力;
5、具有较强的算法开发能力,能够根据业务需求进行算法设计、实现和优化;
6、具备良好的沟通与协调能力,有团队合作精神,善于学习和思考,能够适应快速变化的工作环境;
7、赛事获奖、顶会论文发表或开源项目贡献者优先。

工作地点

北京海淀区浪潮大厦

职位发布者

潘女士/HR

立即沟通
公司Logo浪潮集团公司标签
浪潮集团是中国领先的云计算、大数据服务商,拥有三家上市公司。主要业务涉及计算装备、软件、云计算服务、新一代通信、大数据及若干应用场景。作为中国最早的IT品牌之一,浪潮致力于成为世界一流的新一代信息技术龙头企业经济社会数字化转型的优秀服务商,新型基础设施建设的骨干企业。
公司主页