该职位已失效,看看其他机会吧

AI算法与大模型基建工程师

8000-13000元
  • 无锡滨湖区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

云计算/大数据互联网人工智能
负责整个包括大语言模型的私有化部署与推理优化、文档解析流水线搭建、RAG检索引擎的精调,以及与业务场景深度结合的
Prompt工程设计
岗位职责:
.负责Ollama/vLLM框架下Qwen/GLM系列大模型的本地量化部署,完成显存分配优化和推理性能调优2.搭建并深度调优MinerU文档解析流水线,确保企业内部复杂PDF(含表格、图文混排、公式)的高精度解构3.负责RAGFlow检索引擎的配置、语义分块策略设计以及BGE-M3向量嵌入模型的接入与调优
4.设计面向企业管理场景的Few-shot Prompt模板,提升大模型在WBS任务拆解、实体关系抽取、风险评估等任务上的输出质
5.构建和管理Milvus向量数据库的索引结构,保障海量文档向量的检索效率
6.解决多模型、多并发场景下的GPU显存管理和0OM问题,输出系统级的算力调度方案任职要求:
·本科及以上学历,计算机科学、人工智能、自然语言处理相关专业,硕士优先
-2年以上NLP或大模型相关项目经验熟悉至少种大模型推理框架(vLLM/TGI/Ollama/llama.cpp),有实际的模型量化部署经验(GPTQ/AWQ/GGUF 等格式)熟悉RAG技术栈,了解文本分块、向量检索、Re-ranking等
流程
有Prompt Engineering实战经验,能针对特定业务场景设计和迭代Prompt模板熟悉PyTorch框架,了解 Transformer 架构原理熟悉Linux系统和NVIDIAGPU环境配置(CUDA/cuDNN)
查看全部

工作地点

无锡滨湖区太湖湾信息技术产业园-1号楼

认证资质

营业执照信息

职位发布者

许碧瑶/人事经理

昨日活跃
立即沟通