更新于 今天

大模型应用开发工程师

1-2万
  • 重庆两江新区
  • 大竹林
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

3年以上 PYTHON开发经验ASYNCIO大模型基础AGENT框架经验RAG实践经验
【职位背景】
我们正在构建下一代智能报告审核系统,旨在利用大语言模型(LLM)替代传统人工对复杂的专业报告(如财报、尽调报告、法律文书)进行合规性检查、逻辑校验和风险点挖掘。这是一个高度复杂的Agentic Workflow系统,需要结合RAG(检索增强生成)与多轮规划(Planning)能力,解决长文本、高精度、强逻辑的业务挑战。

【岗位职责】
1. 核心引擎开发: 参与设计并开发基于大语言模型的报告审核引擎,负责核心功能的代码实现,包括报告解析、指令理解、关键信息抽取与逻辑一致性校验。
2. Agent应用构建: 利用LangChain、LangGraph或Agno等框架,设计和实现复杂的多Agent协作系统(如主管Agent、审核Agent、检索Agent、反思Agent),以完成长文档的自动化审核流程。
3. RAG系统优化: 负责RAG链路的工程落地与优化,包括但不限于:文档分块(Chunking)策略优化、Embedding模型选型、混合检索(关键字+向量)召回、重排序(Rerank)以及Prompt压缩,提升知识召回的准确率。
4. 工作流编排: 基于LangGraph或类似的StateGraph框架,设计具备状态管理、循环、分支判断能力的复杂业务流程,确保审核逻辑的可控性和可解释性。
5. 性能与效果调优: 针对大模型推理的幻觉问题,设计校验机制(如Self-Consistency, Function Calling校验);优化Token消耗,降低响应延迟,提升系统稳定性。

【任职要求】
1. 硬性门槛:
○ 统招本科及以上学历,计算机、数学或相关专业,3年以上 Python开发经验,编码习惯良好,熟悉类型注解和异步编程(Asyncio)。
2. 大模型基础:
○ 深入理解Transformer架构、大模型推理原理(如 Attention 机制)、Tokenization 及常见的 Prompt Engineering 技巧(Chain-of-Thought, ReAct)。
○ 熟悉常用大模型(如GPT系列、Claude、Llama、Qwen等)的 API 调用及差异,了解 Function Calling / Tool Calling 的原理。
3. Agent框架经验(核心加分项):
○ 加分: 熟悉 LangChain 生态,熟悉 LangGraph,能够理解 State, Node, Edge 的概念,并利用其构建复杂的循环和图状工作流(有实际落地案例者优先)。
○ 加分: 熟悉 Agno (原Phidata) 框架,或有使用类似框架构建多Agent系统的经验。
4. RAG实践经验:
○ 熟悉 RAG 技术栈,掌握至少一种主流向量数据库(如 Milvus, Chroma, Qdrant, Weaviate)的使用与优化。
○ 了解文本分割的难点(如表格、长文本语义连贯性),有实际解决 RAG 中“查全率”与“查准率”平衡问题的经验。
5. 综合素质:
○ 具备优秀的逻辑思维能力,能够将复杂的业务规则(审核逻辑)转化为清晰的技术方案和Agent提示词。
○ 对技术有热情,具备良好的团队沟通能力和抗压能力。

【加分项】
• 有行业报告处理或审核系统开发经验者优先。
• 有模型微调(SFT/RHLF)经验者优先。
• 在 GitHub 上有高质量的开源项目(尤其是 Agent / RAG 相关)或技术博客者优先。

工作地点

重庆两江新区康美街道金渝大道22号12幢(3层部分)

职位发布者

邹莹/人事经理

当前在线
立即沟通