岗位职责:
1.负责大语言模型(LLM)相关应用的设计、开发与落地,将前沿LLM能力转化为实际产品或解决方案;
2.基于业务场景进行大语言模型选型、微调(Fine-tuning)或提示工程(Prompt Engineering),设计并实现高效、可靠的应用架构;
3.开发基于大语言模型的核心应用模式,如智能对话、内容生成、知识问答、内容审核及检索增强生成(RAG)系统等;
4.负责大语言模型应用的工程化全流程,包括数据处理、服务部署、API集成、性能优化及持续的版本迭代维护;
5.监控与分析大语言模型应用在生产环境中的表现,跟踪效果、成本与延迟,持续优化系统性能与用户体验。
任职要求:
1.本科及以上学历,精通Python/Java,熟悉PyTorch/TensorFlow等框架,对Transformer架构及大语言模型原理有深入理解;
2.工程化落地:具备大语言模型应用架构设计经验,熟练掌握Docker/Kubernetes进行模型与服务部署,熟悉LangChain、LlamaIndex等LLM应用开发框架,能够构建高可用、可扩展的微服务;
3.性能优化:熟悉大语言模型推理加速技术(如vLLM、TGI、TensorRT-LLM),具备模型量化、剪枝等优化经验,能够处理高并发、低延迟的线上场景;
4.精通大语言模型相关的数据处理流程(包括文本清洗、向量化、知识库构建),熟练使用至少一种主流向量数据库(如Milvus、Pinecone、Weaviate),了解大语言模型时代下的MLOps工具链与监控方案;
5.具备优秀的团队协作与沟通能力,能适应快速迭代的开发节奏;持续跟踪大语言模型、提示工程、Agent应用等前沿技术动态,并具备将其转化为业务价值的能力。