作为人工智能应用工程师,您将负责将大型语言模型及其他AI组件集成、微调并投入生产级软件系统的运行。
该职位侧重于训练后的流程工作,包括微调、提示工程、检索增强生成(RAG)、向量数据库集成和模型部署等,而非基础模型的开发。
你将与后端工程师、产品团队和数据团队紧密合作,开发快速、准确、一致且可投入生产的智能应用。
将大型语言模型(LLM)及其他人工智能组件集成到Web和后端应用中。
使用LoRA、QLoRA或监督微调等技术对开放模型进行微调。
利用向量数据库构建RAG管道。
为各类任务设计并优化提示(提示串联、模板化、少样本设置)。
- 封装并部署模型以进行推理
评估并监控人工智能模型在实际环境中的性能表现。
确保在生产环境中实现AI系统的可扩展性、安全性及合规性。
保持对大型语言模型工具生态系统的了解(LangChain、LlamaIndex、OpenAI API、Hugging Face、Spring AI等)
必备资格
计算机科学、工程或相关领域的学士或硕士学位。
- 2年以上构建AI增强型应用或服务的经验。
精通Python,熟悉LangChain、Transformers或Hugging Face数据集等框架。
- 理解向量嵌入及具备向量搜索工具的经验。
熟练掌握模型部署工作流程(例如Docker、REST API、AWS/Microsoft Azure等云服务)。
熟提示工程策略和大型语言模型行为调优。
具备与OpenAI、Anthropic或开源模型(如Mistral或LLaMA)API集成的经验。
-体验使用PEFT方法(LoRA/QLoRA)对模型进行微调。
-熟悉LLMOps、可观测性和模型评估
-接触安全、隐私和负责任的人工智能实践。
-有构建聊天机器人、副驾驶、文档分析器或其他人工智能应用程序的经验。
-对开源AI工具或GenAI工作流程的贡献。