职位概要:
深度参与垂类大模型全流程开发与应用落地,工作内容涵盖模型开发优化(含微调、评估、部署)、复杂业务场景落地(涉及 llm 应用助手、multi agent 编排、MCP应用)、企业级 RAG 系统构建、跨部门协作及数据处理分析、提示词工程等。
岗位职责:
1、深度参与垂类大模型开发全流程,从模型选型开始,精准实施模型微调工作,运用科学方法进行模型评估,确保模型性能卓越。同时,熟练运用常见的大模型本地部署框架(如 vllm/deepspeed/xinference 等),实现模型高效部署。
2、基于复杂业务场景需求,进行全面深入的业务功能分析与解构,设计常见的 llm 应用助手、multi agent 编排、MCP应用等,根据效果评估不断优化方案,推动大模型在实际业务中发挥关键作用。
3、主导设计企业级 RAG 系统及应用,对系统各模块进行全方位优化和评估。在预处理、检索、模型、agentic rag 等多维度开展设计研发工作。
4、基于大模型的应用,设计、开发和维护后端服务、API接口,编写可维护、可扩展的代码;
5、应用大模型能力和Prompt Engineering,将各格式文档(包括但不限于Word、Pdf、Excel、Html)的文字、表格、图片、压缩文件进行解析,确保内容完整读取,对文档中关键表格、关键文字段落进行识别和定位;
6、与算法工程师合作,理解模型能力与局限,定向开发和调试语义算法和程序,处理模型可能产生的“幻觉”、偏见、有害内容或不一致输出;
7、持续优化与大模型的交互速度和延迟,设计和实施评估指标,持续监测大模型应用的实际表现(准确性、相关性、安全性、偏见等);
8、与产品经理合作,定义需求,设计基于大模型的产品功能,完成数据到产品的转化。;
任职资格:
(一)教育背景: 本科及以上学历,计算机、信息工程、软件工程等相关专业。
(二)经验&技能:
1、3-5年工作经验,在 nlp 方向有 2 年及以上工作经验,熟悉 bert/transformer/GPT 等大模型架构,精通意图识别、实体抽取、情感分析等常见场景应用和开发,具备 nlp 系统从数据处理、模型训练到模型部署的全流程实战经验;
2、熟悉主流大模型及其特点,如OpenAI GPT系列,DeepSeek等国产大模型,且有丰富的提示词工程实践经验,能根据不同模型特性和业务需求设计针对性的提示词方案;
3、 有 LLM/RAG 相关项目经验,熟练掌握常见的向量数据(faiss/mivus/chroma 等)应用,熟悉常用的大模型应用开发工具(langchain/LlamaIndex等)。
4、精通 python 编程语言,掌握 cuda 等 GPU 加速技术,能够高效运用技术工具解决实际问题;
5、 深入理解 MCP 协议的架构、工作原理及通信机制,熟练掌握 MCP 协议在不同场景下的应用,能够根据项目需求基于 MCP 协议进行系统搭建和优化;
6、精通数据库操作,库结构、表结构设计,有深厚的数据挖掘、统计、分析、应用理论和实践经验,有至少2个基于大数据的项目经验;
7、 具备qwen/llama/deepseek 等系列模型的微调经验者优先考虑,在模型优化领域有突出表现者将更具优势。拥有 agent 相关知识及编排落地经(dify/coze/n8n 等),能够为项目带来创新思路和解决方案。具备爬虫等数据准备项目经验,可更好地应对数据获取和处理方面的挑战;
(三)态 度:
1、优秀的沟通与协作能力,强烈的学习欲望和能力,能够紧跟最新技术、模型和工具;
2、有强烈的责任心,工作主动积极,认可公司发展目标规划,愿景,及公司价值观,愿意与公司共同发展;