岗位职责:
1、负责知业大模型架构的设计、开发与优化,提升模型性能和效率,使模型具备多模态数据分析理解能力;
2、负责知业大模型优化迭代,包括模型微调、数据蒸馏、模型蒸馏等,提高知业大模型在行业领域的应用落地能力;
3、负责行业Agent智能体技术开发应用;
4、探索和实现模型压缩、量化等技术,降低模型的计算和存储成本;
5、熟悉大模型分布式部署技术,有效提高大模型的高并发、高吞吐、低时延。
任职资格:
1、硕士及以上学历,计算机科学、人工智能相关专业优先;5年以上大模型、算法相关工作经验;
2、具有以下一个或多个领域的理论背景和实践经验:机器学习/数据挖掘/深度学习/信息检索/自然语言处理/机制设计/博弈论;
3、熟悉精通至少一种主流的大模型相关集成开发框架,如:LangChain、Haystack、OpenAIAssistant、LlamaIndex等;
4、机器学习应用:主导过LLM/CV/NLP等机器学习领域的数据->训练->推理->应用的落地,或者相关支撑平台的研发;
5、大模型应用:主导过数据集构造(对话、RLHF等)、高效微调(Lora/P-Tuning/RLHF)、推理部署、应用(Prompt工程、检索增强等)项目场景落地;
6、有海量数据处理、最优化算法、分布式计算或高性能并行计算相关项目经验;
7、拥有多模态对齐技术开发能力,包括不限于图片、音频、视频等模型数据;
8、熟悉大模型训练和推理系统的开发与维护,包括分布式训练框架、高效推理引擎等;
9、熟悉大模型性能评估体系,根据相关性能指标,分析模型性能瓶颈,并具备根据评估结果,优化模型结构、训练策略及推理流程,提升模型得准确性和推理效率。