雇员点评标签
职位描述
PyTorch机器人算法CNNRNNLSTMCRFTensorFlowCaffe
岗位职责】
1、AI Agent系统架构与开发:负责基于大语言模型(LLM)的智能体(Agent)系统设计,利用LangGraph/AutoGen等框架构建具备多步推理、工具调用(Tool Use)、记忆管理及多智能体协作能力的复杂业务应用。
2、高级RAG与知识引擎建设:主导企业级知识库的构建,实现多模态RAG(支持图文、表格解析)、GraphRAG(结合知识图谱增强检索)及混合检索策略,显著降低模型幻觉,提升垂直领域问答准确率。
3、模型微调与私有化部署:负责开源模型(如Qwen3, Llama 4等)的指令微调(SFT)与偏好对齐(RLHF/DPO);掌握vLLM/TensorRT-LLM推理加速技术,实现模型在本地服务器或边缘设备的低成本、高并发私有化部署。
4、AI原生应用落地:与产品团队深度协同,将AI能力融入核心业务流程(如智能客服、自动化运维、金融风控、营销文案生成等),设计并实施Human-in-the-loop(人机协同)机制,确保系统可控性与安全性。
5、工程化与评估体系:搭建LLM Ops流水线,建立自动化的模型评估(Eval)体系(包括准确性、鲁棒性、延迟监控),持续优化Prompt策略与模型参数,保障生产环境稳定性。
6、前沿技术探索:跟踪并验证MCP(Model Context Protocol)、端侧小模型(SLM)、视频生成理解等2026年新技术,推动其在公司产品中的创新应用。
【任职要求】
学历背景:计算机科学、软件工程、人工智能或相关领域本科及以上学历。
经验要求:
2年以上Python开发经验,其中至少1年专注于大模型应用开发。
有完整的Agent项目落地案例(非Demo),熟悉ReAct、Plan-and-Solve等推理模式者优先。
核心技术栈:
编程语言:精通Python,熟悉AsyncIO异步编程,了解TypeScript/Node.js(用于全栈AI应用)者加分。
框架工具:熟练掌握LangChain/LangGraph、LlamaIndex、Haystack;熟悉AutoGen、CrewAI等多智能体框架。
模型能力:深入理解Transformer架构,熟悉HuggingFace生态;熟练使用Llama Factory、Axolotl等工具进行模型微调;掌握Ollama、vLLM进行本地推理服务搭建。
RAG专精:精通向量数据库(Milvus, Qdrant, Chroma或Elasticsearch向量插件),有处理非结构化数据(PDF, Word, 图片OCR)清洗与切片实战经验,了解Embedding模型选型与优化。
Prompt工程:超越基础提示词,精通Structured Output (JSON Mode)、Few-Shot动态构建、CoT思维链优化及Prompt安全防御(防注入)。
工程化能力:
熟悉Linux环境,精通Docker容器化,了解Kubernetes (K8s) 进行大规模模型服务编排。
熟悉CI/CD流程,有GPU资源调度与显存优化经验。
综合素质:具备良好的数学基础与逻辑思维,对数据敏感;拥有极强的自驱力,能快速阅读英文技术论文并转化为代码实现;优秀的沟通协作能力。
【加分项】
AI智能编程(AI-Native Coding)专家经验:
深度熟练使用 Cursor、GitHub Copilot Workspace、Windsurf 等新一代AI编程助手,具备“人机结对编程”的高效工作流,能利用AI将提升开发效率 。
有利用LLM进行大规模遗留代码重构、自动化单元测试/集成测试生成、智能Code Review及自动修复Bug的实战经验。
熟悉 Repo-level Context(仓库级上下文) 处理技术,能够搭建或优化基于企业私有代码库的内部AI编程助手
行业经验:有金融、法律等高门槛领域的AI落地经验,熟悉相关行业合规与数据安全标准。
多模态能力:熟悉CLIP、BLIP等多模态模型,有视频内容理解或图文混合生成项目经验。
开源贡献:在GitHub上有高星AI相关开源项目贡献,或有高质量的技术博客/社区文章。
全栈能力:具备Streamlit, Gradio, Next.js等前端框架能力,能独立快速构建AI应用原型(Prototype)。
1、AI Agent系统架构与开发:负责基于大语言模型(LLM)的智能体(Agent)系统设计,利用LangGraph/AutoGen等框架构建具备多步推理、工具调用(Tool Use)、记忆管理及多智能体协作能力的复杂业务应用。
2、高级RAG与知识引擎建设:主导企业级知识库的构建,实现多模态RAG(支持图文、表格解析)、GraphRAG(结合知识图谱增强检索)及混合检索策略,显著降低模型幻觉,提升垂直领域问答准确率。
3、模型微调与私有化部署:负责开源模型(如Qwen3, Llama 4等)的指令微调(SFT)与偏好对齐(RLHF/DPO);掌握vLLM/TensorRT-LLM推理加速技术,实现模型在本地服务器或边缘设备的低成本、高并发私有化部署。
4、AI原生应用落地:与产品团队深度协同,将AI能力融入核心业务流程(如智能客服、自动化运维、金融风控、营销文案生成等),设计并实施Human-in-the-loop(人机协同)机制,确保系统可控性与安全性。
5、工程化与评估体系:搭建LLM Ops流水线,建立自动化的模型评估(Eval)体系(包括准确性、鲁棒性、延迟监控),持续优化Prompt策略与模型参数,保障生产环境稳定性。
6、前沿技术探索:跟踪并验证MCP(Model Context Protocol)、端侧小模型(SLM)、视频生成理解等2026年新技术,推动其在公司产品中的创新应用。
【任职要求】
学历背景:计算机科学、软件工程、人工智能或相关领域本科及以上学历。
经验要求:
2年以上Python开发经验,其中至少1年专注于大模型应用开发。
有完整的Agent项目落地案例(非Demo),熟悉ReAct、Plan-and-Solve等推理模式者优先。
核心技术栈:
编程语言:精通Python,熟悉AsyncIO异步编程,了解TypeScript/Node.js(用于全栈AI应用)者加分。
框架工具:熟练掌握LangChain/LangGraph、LlamaIndex、Haystack;熟悉AutoGen、CrewAI等多智能体框架。
模型能力:深入理解Transformer架构,熟悉HuggingFace生态;熟练使用Llama Factory、Axolotl等工具进行模型微调;掌握Ollama、vLLM进行本地推理服务搭建。
RAG专精:精通向量数据库(Milvus, Qdrant, Chroma或Elasticsearch向量插件),有处理非结构化数据(PDF, Word, 图片OCR)清洗与切片实战经验,了解Embedding模型选型与优化。
Prompt工程:超越基础提示词,精通Structured Output (JSON Mode)、Few-Shot动态构建、CoT思维链优化及Prompt安全防御(防注入)。
工程化能力:
熟悉Linux环境,精通Docker容器化,了解Kubernetes (K8s) 进行大规模模型服务编排。
熟悉CI/CD流程,有GPU资源调度与显存优化经验。
综合素质:具备良好的数学基础与逻辑思维,对数据敏感;拥有极强的自驱力,能快速阅读英文技术论文并转化为代码实现;优秀的沟通协作能力。
【加分项】
AI智能编程(AI-Native Coding)专家经验:
深度熟练使用 Cursor、GitHub Copilot Workspace、Windsurf 等新一代AI编程助手,具备“人机结对编程”的高效工作流,能利用AI将提升开发效率 。
有利用LLM进行大规模遗留代码重构、自动化单元测试/集成测试生成、智能Code Review及自动修复Bug的实战经验。
熟悉 Repo-level Context(仓库级上下文) 处理技术,能够搭建或优化基于企业私有代码库的内部AI编程助手
行业经验:有金融、法律等高门槛领域的AI落地经验,熟悉相关行业合规与数据安全标准。
多模态能力:熟悉CLIP、BLIP等多模态模型,有视频内容理解或图文混合生成项目经验。
开源贡献:在GitHub上有高星AI相关开源项目贡献,或有高质量的技术博客/社区文章。
全栈能力:具备Streamlit, Gradio, Next.js等前端框架能力,能独立快速构建AI应用原型(Prototype)。
展开该职位详情




