职位描述
深度学习图像算法大模型算法
暖通测试总监
1. 从0到1架构设计并实现基于LLM的 AI 应用系统,包括多 Agent 协作架构、任务拆解、调度以及工具调用机制、Agentic Workflow的设计。
2. 构建高效的上下文管理策略,解决长文本信息丢失问题,并设计长期记忆与短期记忆体系,同时优化 KV Cache 使用和 Token 成本。
3. 搭建检索增强生成(RAG)系统,设计知识切片策略,完成 Embedding 选型与效果评估,实现混合搜索和重排序优化,降低模型输出幻觉风险。
4. 构建可维护的 Prompt 模板系统,运用 Chain-of-Thought、Self-Reflection 等技巧提升生成质量,并建立评估体系量化 Prompt 表现。
5. 通过 Vibe Coding 快速构建 MVP,通过"人+AI"协作开发流程,实现产品快速迭代与落地。
任职要求
1. 具备三年以上后端或全栈开发经验,精通 Python 或 TypeScript,并对 Transformer 架构和 Token 机制有深入理解。
2. 必须具备完整 RAG 或 Agent 项目落地经验,对OpenAI、Claude 、国产模型的优缺点极为熟悉,并了解 LangChain、LlamaIndex 或类似生态框架。
3. 能清晰说明如何解决上下文溢出问题、降低 RAG 幻觉风险、优化 Token 成本,并具备多 Agent 系统设计经验。
4. 有本地模型部署经验(如 Ollama、vLLM、llama.cpp)、自动化集成经验(如 飞书、Gmail API、Discord Bot、Telegram Bot)。
5. 具备结构化思考能力,能够解释设计决策,理解大模型是概率系统而非确定性程序,同时具有产品意识,将 AI 能力转化为实际可用的应用。
6. 有AI 开源项目经验或技术博客、以及模型微调经验优先。
1. 从0到1架构设计并实现基于LLM的 AI 应用系统,包括多 Agent 协作架构、任务拆解、调度以及工具调用机制、Agentic Workflow的设计。
2. 构建高效的上下文管理策略,解决长文本信息丢失问题,并设计长期记忆与短期记忆体系,同时优化 KV Cache 使用和 Token 成本。
3. 搭建检索增强生成(RAG)系统,设计知识切片策略,完成 Embedding 选型与效果评估,实现混合搜索和重排序优化,降低模型输出幻觉风险。
4. 构建可维护的 Prompt 模板系统,运用 Chain-of-Thought、Self-Reflection 等技巧提升生成质量,并建立评估体系量化 Prompt 表现。
5. 通过 Vibe Coding 快速构建 MVP,通过"人+AI"协作开发流程,实现产品快速迭代与落地。
任职要求
1. 具备三年以上后端或全栈开发经验,精通 Python 或 TypeScript,并对 Transformer 架构和 Token 机制有深入理解。
2. 必须具备完整 RAG 或 Agent 项目落地经验,对OpenAI、Claude 、国产模型的优缺点极为熟悉,并了解 LangChain、LlamaIndex 或类似生态框架。
3. 能清晰说明如何解决上下文溢出问题、降低 RAG 幻觉风险、优化 Token 成本,并具备多 Agent 系统设计经验。
4. 有本地模型部署经验(如 Ollama、vLLM、llama.cpp)、自动化集成经验(如 飞书、Gmail API、Discord Bot、Telegram Bot)。
5. 具备结构化思考能力,能够解释设计决策,理解大模型是概率系统而非确定性程序,同时具有产品意识,将 AI 能力转化为实际可用的应用。
6. 有AI 开源项目经验或技术博客、以及模型微调经验优先。
工作地点
北京朝阳区望京诚盈中心

认证资质
营业执照信息

更新于 5月26日





