【岗位内容】
1、负责人工智能应用中大模型相关模块的开发工作,深入理解业务场景需求,参与智慧问数、多源异构数据融合识别、决策辅助、自动化流程等AI能力的需求分析,并参与模型选型、微调策略、推理优化及系统集成方案的设计。
2、根据技术方案或产品需求,使用 Python 等语言开发基于大模型的Agent系统,包括工具调用(MCP)、记忆管理、多轮推理、自主规划等核心能力,并实现可编排、可监控的工作流引擎。
3、对算法模块的质量与性能进行全面把控,设计并实施评估指标(如准确性、响应延迟、幻觉率等),编写自动化测试与压力测试脚本,负责 RAG 知识库检索、向量索引构建、上下文注入等关键链路的调试与优化,确保线上服务的高可用与低延迟。
4、在系统研发过程中,分析并解决大模型部署(如 vLLM、TGI)、知识库更新一致性、Agent 决策稳定性、工作流状态管理等复杂技术问题,负责已上线 AI 服务的运维支持、效果追踪与持续迭代,推动算法能力在实际业务中的深度落地。
【岗位要求】
- 计算机相关专业本科及以上学历,具备扎实的编程基础与算法功底。3年以上相关工作经验。
- 精通Python开发,熟悉大模型生态(如LLaMA、GPT系列),有Agent系统开发经验优先。
- 掌握工具调用、记忆机制、RAG等智能体核心技术,了解vLLM、TGI等大模型部署框架。
- 具备系统性能优化与问题排查能力,能独立解决高并发、低延迟场景下的技术挑战。
- 拥有良好的业务理解能力与跨团队协作能力,能快速将业务需求转化为技术方案。