更新于 11月26日

AI 工程师(大模型私有化与场景化应用方向)

1-2万
  • 武汉武昌区
  • 1-3年
  • 本科
  • 全职
  • 招2人

职位描述

深度学习大模型算法多模态算法计算机软件人工智能
一、岗位职责
大模型私有化部署与优化
主导 LLaMA、ChatGLM、DeepSeek 等主流开源大模型的本地化部署,完成 GPU/CPU 资源调度、推理性能优化及容器化部署(Docker/K8s),确保私有化环境下的模型高效运行与稳定性。
场景化 AI 系统构建
设计并落地 RAG(检索增强生成)系统,涵盖文档分块、Embedding 生成、向量检索(Milvus/Pinecone)全链路,提升垂直领域(如政务)知识问答准确率;
开发行业专属 AI Agent,结合 LangChain/LlamaIndex 工具链,实现多轮对话、任务拆解与自动化流程(如政策文件检索、智能客服),推动业务场景智能化。
模型全生命周期管理
负责数据清洗、标注及增强,完成模型微调(LoRA/P-tuning)、量化压缩(GGML/INT4)及蒸馏优化,降低部署成本;
搭建模型评估体系,通过 Prompt Engineering 与用户反馈迭代优化生成质量,输出运维报告并提出架构升级方案。
合规与创新探索
遵循《数据安全法》等法规,设计数据脱敏、权限控制方案,保障私有化部署的安全性;
探索多模态(文本 + 图像)检索、AutoGPT 类复杂流程自动化等前沿技术,拓展 AI 应用边界。
二、任职要求
1. 硬性条件
学历:计算机 / 人工智能 / 数学相关专业本科及以上,3 年以上大模型研发经验;
经验:主导过至少 1 个大模型私有化部署全流程项目(从选型、调优到落地),具备政务等垂直领域场景化开发案例。
2. 技术能力
语言与框架:精通 Python,熟练使用 PyTorch/TensorFlow,熟悉 Hugging Face 生态;掌握 C++/Java 者优先;
模型工程:熟悉 Transformer 架构,精通模型量化、剪枝、图优化技术,有 LoRA 微调、RAG 系统实战经验;
工具链:熟练运用 LangChain/LlamaIndex 构建 Agent,掌握向量数据库(Milvus/Pinecone)、知识图谱(Neo4j)开发;
部署与优化:熟悉 Docker/K8s 容器化,具备 GPU 性能调优(CUDA/OpenVINO)或移动端部署经验。
3. 项目与业务理解
能从业务痛点反推技术方案,主导过 AI Agent 与 CRM/OA 等系统的集成;
熟悉私有化部署全链路,包括 API 封装、模型监控、资源调度,具备成本优化意识。
4. 软性能力
协作:擅长与产品、客户沟通,清晰解释技术方案,适应敏捷开发;
合规:重视数据安全,熟悉行业隐私保护规范;
学习:跟踪大模型前沿(如 Agent、MoE),具备技术转化落地能力。
三、加分项
在知识图谱构建、多模态检索、模型轻量化(如 GGUF 格式)等方向有深度实践;
主导过千万级数据量的 RAG 系统优化,检索准确率提升超 15%;
熟悉大模型评测工具(MMLU/HumanEval),具备 A/B 测试与效果归因能力。
我们期待:不仅是技术专家,更是懂业务的 “AI 落地者”—— 既能解决模型部署的性能难题,也能让 Agent 成为客户业务的 “智能助手”。

工作地点

武汉武昌区万达尊B座615室

职位发布者

孙倩/人事经理

刚刚活跃
立即沟通
公司Logo湖北天智联创技术有限公司
湖北天智联创技术有限公司办公室地址位于世界各大城市中人均拥有淡水量多的城市--武汉,于2007年06月15日在武汉东湖新技术开发区注册成立,注册资本为500万元人民币,在公司发展壮大的13年里,我们始终为客户提供好的产品和技术支持、健全的售后服务,我公司主要经营软件研发及维护,计算机软硬件的技术开发、技术咨询、技术转让、技术服务及销售;计算机网络工程设计;通信设备销售;移动通信产品业务代理(不含增值电信业务)。(依法须经批准的项目,经相关部门批准后方可开展经营活动)
公司主页