更新于 3月10日

AI 算法与大模型基建工程师

1.4-1.8万
  • 无锡滨湖区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

计算机软件人工智能
岗位概述:
负责整个包括大语言模型的私有化部署与推理优化、文档解析
流水线搭建、RAG 检索引擎的精调,以及与业务场景深度结合的
Prompt 工程设计。
岗位职责:
1. 负责 Ollama/vLLM 框架下 Qwen/GLM 系列大模型的本地量
化部署,完成显存分配优化和推理性能调优
2. 搭建并深度调优 MinerU 文档解析流水线,确保企业内部复
杂 PDF(含表格、图文混排、公式)的高精度解构
3. 负 责 RAGFlow 检 索 引 擎 的 配 置 、 语 义 分 块 策 略 设 计 以 及
BGE-M3 向量嵌入模型的接入与调优
4. 设计面向企业管理场景的 Few-shot Prompt 模板,提升大模
型在 WBS 任务拆解、实体关系抽取、风险评估等任务上的输出质

5. 构建和管理 Milvus 向量数据库的索引结构,保障海量文档
向量的检索效率
6. 解决多模型、多并发场景下的 GPU 显存管理和 OOM 问题,
输出系统级的算力调度方案
任职要求:
- 本科及以上学历,计算机科学、人工智能、自然语言处理相
关专业,硕士优先
- 2 年以上 NLP 或大模型相关项目经验
- 熟 悉 至 少 一 种 大 模 型 推 理 框 架
( vLLM/TGI/Ollama/llama.cpp ) , 有 实 际 的 模 型 量 化 部 署 经 验
(GPTQ/AWQ/GGUF 等格式)
- 熟悉 RAG 技术栈,了解文本分块、向量检索、Re-ranking 等
流程
- 有 Prompt Engineering 实战经验,能针对特定业务场景设计和
迭代 Prompt 模板
- 熟悉 PyTorch 框架,了解 Transformer 架构原理
- 熟悉 Linux 系统和 NVIDIA GPU 环境配置(CUDA/cuDNN)
- 熟练使用 Python 进行算法开发

工作地点

无锡滨湖区太湖湾信息技术产业园

认证资质

营业执照信息

职位发布者

袁女士/HR

今日活跃
立即沟通
公司Logo江苏毓贤汇思信息科技有限公司
汇思人力集团,2001年始创于苏州,是苏州第一家取得外包资质、华东地区第一家实践生产外包的人力资源服务商。现已发展成为中国人力资源服务行业领军企业。以蓝领优势、科技赋能、投资整合三位一体的方式深耕人力资源服务领域,依托专业先发优势和持续研发创新,助力国央企、大中型企业、政府、高校、公益机构等各类型、各行业客户降本增效、防控用工风险,提升企业效能。始终围绕客户价值和企业愿景使命,致力于成为最具价值的人力资源综合服务商,成就中国人力资源服务业卓越的民族品牌!
公司主页