更新于 11月20日

大模型数据工程师

1.8-3.5万
  • 北京丰台区
  • 经验不限
  • 硕士
  • 全职
  • 招1人

职位描述

大模型算法数据处理过程管理
岗位职责
1、负责大语言模型预训练算法和底层原理研究;
2、负责大语言模型在垂直领域的微调、蒸馏等方法研究与实现;
3、负责大语言模型与视觉模型的结合应用研究与实现;
4、负责大语言模型与知识图谱技术的融合研究与实现;
5、负责大语言模型在具体业务场景中的应用落地。
任职资格
1.计算机科学或人工智能等相关专业,硕士及以上学历;
2.NLP、大语言模型等研究方向,信息挖掘、知识图谱等相关领域;
3.编程功底扎实,熟练使用C++或Python等编程语言;
4.熟练使用常用的深度学习框架,如TensorFlow、PyTorch等;
5.熟悉主流大语言模型(GPT/T5/PaLM/LLaMA/GLM等)的原理和训练方法,对模型设计和适用场景有深入的理解;
6.熟悉大语言模型训练、微调和优化策略,如高质量数据清洗、模型质量评估、Pretrain、SFT、RLHF等;
7.熟悉利用大语言模型进行知识图谱的构建和融合;
8.熟悉利用大语言模型进行业务应用构建的相关技术,如:LangChain、向量数据库等。
9.具有分析问题和解决问题的能力,能够自我驱动,具有良好的团队合作精神,较强的沟通能力。
加分项:
1.具备大模型预训练,文本生成,多轮对话、知识图谱、常识推理、推荐搜索、多模态理解、信息检索等方面实践经验者优先。
2.有大规模分布式训练部署等经验优先。

工作地点

丰台区北京总部基地12区3号楼

职位发布者

王女士/人力

刚刚活跃
立即沟通
公司Logo航天科工(北京)空间信息应用股份有限公司
航天科工(北京)空间信息应用股份有限公司(简称:航天空间应用公司)是中国航天科工集团有限公司旗下专业从事空间信息应用的高科技企业。公司成立于2001年,是国内最早从事自主知识产权遥感软件研发的企业,经过20余年的发展,公司产品和服务广泛应用国防、政府、企业等领域,成为国内一流、以遥感为核心的空间信息应用产品和服务提供商。公司形成了完整的空间信息处理、管理、应用的核心技术和产品体系,拥有发明专利50余项,软件著作权500余项。时空信息云服务平台、遥感图像处理超算平台等核心产品及关键技术处于国内领先、国际一流水平,打通了空间信息存储、管理、计算、分发、服务全链条,成功应用于天基信息支援、战场环境保障、高分辨率对地观测国家重大专项、自然资源调查监测、智慧海洋等国家重大科技和工程专项。智慧林草云平台产品成功应用于山水林田湖草生态修复、生态保护支撑体系、林草生态感知系统等国家重大工程,成为全国20余省、200多个市县级林草部门的核心平台,市场占有率行业领先。公司产品应用成效卓越,社会、经济、生态效益显著得到了各界的好评,被中央电视台、新华社等中央媒体广泛报道。公司拥有一流的人才队伍,博士、硕士研究生学历占公司总人数50%以上,平均年龄30岁,富有朝气与活力,拥有中央军委科技委专家、国务院特殊津贴专家、北京市“科技新星”、航天科工集团“巾帼建功”、航天系统公司“杰出青年”等领军人才。公司拥有一流的科技创新能力,承担国家重大专项、国家重点研发计划等重大科研项目30余项,拥有北京市企业技术中心、福建省卫星海洋遥感与通讯工程中心、集团空间数据服务中心等多个国家级、省级、行业级创新条件平台,与国内多所一流-高校、研究所共建有联合实验室、研发中心等,联合培养研究生、博士后。公司是多个国家标准化管理委员会专委会成员,承担、参与国家标准、行业标准近20项。科技创新成果卓著,土地调查监测空天地一体化技术开发与装备研制项目荣获国家科技进步二等奖,影像高性能处理分析技术等核心技术荣获省部级科技进步一等奖、二等奖10余项,公司承担的林草、海洋、环保等项目先后荣获地理信息优秀工程银奖、铜奖20余项。公司拥有一流的资质体系,已获得测绘资质甲级、电子与智能化承包二级、CMMI软件能力成熟度模型集成、ITSS信息技术服务标准、ISO9001质量管理、ISO27000信息安全管理等20余项资质证书与体系认证,标志着公司具备了测绘地理信息、软件研发、信息系统集成、信息安全、电子智能化、军工等多领域综合资质能力,是国内空间信息应用领域资质体系最全、级别最高、综合性最强的企业之一。
公司主页