一、岗位背景与趋势
2025-2026 年是 AI 应用从“对话”走向“行动”的关键年。我们不再满足于简单的 Chatbot,而是致力于构建自主代理(Agent)、图谱增强(GraphRAG)与工作流编排(Workflow) 驱动的工业级系统。本岗位将直接接触Model Context Protocol (MCP)、LangGraph 编排、自动化评估(Eval) 等前沿技术栈。我们需要一位工程基础扎实、对 AI 架构有追求的工程师,与团队共同攻克技术深水区。
二、核心职责 (Responsibilities)
1.工业级多智能体编排(Multi-Agent Orchestration):
1.参与研发支持高并发、高可用的大模型多智能体总控系统(Orchestrator)。
2.基于 LangGraph/StateGraph 思想,解决真实业务高峰期多个 Agent 之间的资源争抢、状态锁定及死锁问题。
3.为复杂的 Agentic Workflow 设计类似于分布式 Saga 的事务控制与状态回滚(Rollback)机制。
2.Advanced RAG 研发与调优:
1.深入业务深水区,构建并优化千万级文档的检索增强生成系统。
2.落地 GraphRAG(知识图谱检索)、动态 Query 意图路由、多路混合召回(Dense + Sparse + Graph)及 RRF 重排序策略。
3.从根本上解决工业复杂长文本的“召回难、幻觉多”痛点。
3.动态工具与协议标准化:
1.基于 MCP (Model Context Protocol) 或自研标准,设计 Skill Agents 的动态发现、注册与调用机制。
2.赋予大模型在陌生环境中动态理解 OpenAPI Schema 并进行自我纠错(Self-Correction)的能力。
4.工程化与性能优化:
1.负责 Agent 运行时环境与通信总线的开发与维护(主流语言 Python)。
2.协助进行模型推理优化(如 vLLM 部署、缓存策略),降低 Token 成本与首字延迟(TTFT)。
5.评估体系与安全合规:
1.构建自动化评估 pipeline(LLM-as-a-Judge),监控线上效果,建立数据飞轮持续迭代。
2.负责 AI 安全护栏建设,防御提示词注入、数据泄露及内容合规风险。
三、任职要求 (Requirements)
1. 编程语言与基础(硬性)
Python 精通: 具备扎实的 Python 编程能力,熟悉异步编程(Asyncio)、多线程/多进程,了解内存管理及性能优化。
工程化能力: 熟悉 Linux 环境,熟练使用 Docker、Git,了解 CI/CD 流程,代码风格规范,具备良好的文档习惯。
后端基础: 熟悉 Web 框架(FastAPI/Flask),了解消息队列(Kafka/RabbitMQ)及数据库(MySQL/PostgreSQL)的使用。
2. 大模型与 Agent 生态(硬性)
落地经验: 至少有一个完整的大模型应用落地项目(非 Demo),熟悉 LangChain、LlamaIndex 或 LangGraph 等框架的原理与使用。
RAG 实战: 深刻理解向量数据库(Milvus/Qdrant/ES)的使用,有实际处理过检索精度优化、数据清洗、分片策略的经验。
Agent 开发: 理解 Function Calling、Tool Use 原理,有实现过复杂任务编排或工作流引擎的经验。
模型理解: 理解 Transformer 基本原理,熟悉主流模型特性,具备 Prompt Engineering 及基础微调(SFT/LoRA)认知。
3. 架构与思维(硬性)
问题解决: 具备独立排查生产环境问题的能力,能区分是模型问题、检索问题还是代码逻辑问题。
学习潜力: 对新技术保持敏感,能够快速阅读英文文档及论文,并将其转化为工程实践。
四、加分项 (Nice to Have)
以下技能不作为入职门槛,但具备者将获得更高定级及重点培养:
Rust 语言: 具备 Rust 开发经验,理解所有权机制、Actor 模型(如 Actix),能参与高性能模块重构。
高并发架构: 有分布式系统设计经验,理解一致性协议、事务处理及高可用架构设计。
开源贡献: 在 Github 上有 AI 相关开源项目贡献或高 Star 项目。
硬核场景: 有在工业制造、金融交易等对“准确率与可用性”要求极苛刻的场景落地经验。
底层优化: 熟悉 vLLM、TensorRT-LLM 等推理引擎及显存调度优化策略。
前沿技术: 熟悉 SLM(端侧模型)、多模态大模型(LMM)或具身智能相关技术。
五、我们提供 (Benefits)
技术成长: 接触行业前沿的 Multi-Agent、GraphRAG 与 MCP 协议,资深架构师一对一指导,提供充足的学习缓冲期。
核心业务: 直接参与公司核心 AI 产品线,拒绝边缘业务,您的代码将直接产生业务价值。
算力资源: 充足的 GPU 算力集群及真实且极具挑战的工业级海量业务数据。
氛围文化: 扁平化管理,拥抱新技术,鼓励试错与创新,定期技术分享。
其他福利: 弹性工作制,年度体检,节日福利,团建活动。