职位描述
IT服务
岗位要求: 1.专业背景:计算机科学相关专业本科及以上学历,3 年以上后端或 AI 研发经验。 2. 核心 AI 技术栈: 精通 Python,熟练使用 LangChain、LlamaIndex 或 LangGraph。 深刻理解不同 Embedding 模型(OpenAI, Cohere, BGE 等)的应用场景。 3. 数据库深度能力: MongoDB:精通聚合管道(Aggregation Pipeline),有实际的 Atlas Vector Search 开发经验。 4. Pinecone:熟悉 Pinecone 的 Serverless 与 Pod 架构,具备大规模向量索引优化、Namespace 管理及 Metadata 过滤经验。 5.工程化能力: 理解向量相似度算法(Cosine, Euclidean, Dot Product)及其适用场景。 熟悉 Docker/K8s,具备 FastAPI 或 Go 等高性能后端服务的开发部署经验。 6. 加分项: 有生产环境下的大规模 RAG 落地经验。 熟悉分布式缓存(Redis)在 Agent 对话上下文管理中的应用。 关注 AI 领域前沿进展,如 GraphRAG 或 Agentic 工作流优化。 工作职责: 1.智能体架构设计:基于 LangGraph 或同类框架设计具备长短期记忆、工具调用及多步推理能力的 Agent 系统。 2. 多模态检索策略: 利用 MongoDB Atlas Vector Search 实现业务元数据与向量数据的混合检索(Hybrid Search)。 针对高并发、大规模知识库场景,设计并维护 Pinecone 向量索引,优化召回率与检索延迟。 3.数据管道与 ETL:构建自动化数据流水线,负责将非结构化文档、业务数据库数据清洗、嵌入(Embedding)并同步至 MongoDB 或 Pinecone。 4.RAG 性能优化:针对检索质量进行微调,包括 Query 转换(HyDE/多查询生成)、重排序(Rerank)、以及针对不同向量库索引算法(如 HNSW)的参数优化。 5. 系统稳定性与可扩展性:设计支持多租户隔离的向量存储方案,并确保业务数据库与专用向量库之间的数据一致性。 语言要求:英语口语熟练,要和国外项目组参加会议
展开该职位详情




