更新于 1月31日

大模型全栈研发工程师

1.3-1.6万
  • 南京秦淮区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

人工智能
主要职责:
(1)大模型训练与调优:设计、实施并优化大模型的训练流程,包括数据准备、模型架构选择、超参数调整、分布式训练策略制定与执行。具有实际参与大型深度学习模型(特别是Transformer-based模型,如BERT, GPT系列, T5, LLaMA, 多模态模型等)训练项目的经验。
(2)模型开发与实现:参与或主导大模型的研发、复现、改进和适配工作。
(3)性能优化:解决大模型训练中的性能瓶颈(计算、通信、内存),进行显存优化、计算效率提升和通信优化。
(4)技术栈应用:熟练运用主流的大模型训练框架和工具(如PyTorch, TensorFlow, DeepSpeed, Megatron-LM, FSDP, Hugging Face Transformers等)。
(5)数据处理:设计和管理用于大模型训练的海量、高质量数据集,包括数据清洗、预处理、增强和安全管理。
(6)模型部署与应用探索:探索训练后模型的部署方案(如推理优化)及其在具体业务场景(如智能问答、内容生成、代码辅助、知识管理、AIGC等)中的应用潜力。
(7)技术跟踪与分享:跟踪大模型领域的前沿技术动态,并在团队内进行技术分享。

工作地点

南京秦淮区中国平安人寿保险(江苏分公司)

职位发布者

朱先生/人事经理

刚刚活跃
立即沟通
公司Logo智联猎头
智联猎头作为智联招聘旗下品牌,以满足企业中高端岗位的人才招聘需求为出发点,整合全球优质资源,覆盖数字经济、新一代信息技术、人工智能、金融、电子信息、装备制造、生物医药与健康、房地产/建筑等数十个行业,拥有规模庞大、覆盖面广的交付团队,致力于向企业输出专业化的招聘解决方案。智联猎头目前拥有卓聘平台服务、招聘流程外包服务、高端人才猎寻服务三大类核心服务,具备高度定制化能力,能够为不同发展阶段的企业提供一站式招聘解决方案,同时为企业转型升级提供保障,全面增强企业核心竞争力!智联猎头利用自身独特的资源优势、成熟的服务模式,以及多层次的产品,致力于打造高效、专业的一站式人才服务模式,让招聘更加美好!
公司主页