职位描述
深度学习机器学习大模型算法人工智能产业互联网平台计算机软件
AI大模型算法工程师(LLM方向)
我们正在寻找一名热爱人工智能技术、具备大模型开发与落地能力的算法工程师,参与公司AI核心能力建设,
基于大语言模型(LLM)构建智能应用,推动产品智能化升级与创新。
工作时间:双休,8:30-17:30
薪资待遇:面议 (根据能力提供具有竞争力的薪资)
主要职责
1.大模型应用开发与优化
·基于主流大语言模型(如 GPT、Qwen、LLaMA、DeepSeek 等)开发业务应用
·设计并优化 Prompt Engineering、RAG(检索增强生成)、Agent 等系统
·提升模型在实际业务场景中的效果、稳定性和响应速度
2.模型微调与训练
·基于业务数据进行模型微调(SFT、LoRA、QLoRA 等)
·构建高质量训练数据集,优化模型表现
·参与模型评估体系设计与效果优化
3.推理优化与部署
·使用vLLM、TensorRT、ONNXRuntime 等推理框架部署模型
·优化模型推理性能,降低延迟和资源消耗
·支持 GPU 推理、量化、并发优化等工作
4.AI系统架构设计
·参与AI系统架构设计,包括模型服务、向量数据库、RAG系统等
·构建稳定、高可用的大模型服务架构
5.技术研究与创新
·跟踪大模型领域前沿技术(LLM、Agent、多模态等)
·探索新技术在公司产品中的落地应用
6.跨团队协作
·与产品、后端工程师协作,推动AI功能落地
·提供技术方案并参与产品设计
任职要求
必备条件
1.研究生及以上学历,计算机、人工智能、软件工程等相关专业
2.熟练使用 Python,具备良好的编程基础
3.熟悉至少一种深度学习框架:
·PyTorch (优先)
· TensorFlow
4。熟悉大语言模型相关技术:
· Prompt Engineering
·RAG架构
·向量数据库(Milvus / FAISS / Chroma/pgvector)
5.熟悉常用AI开发框架:
· LangChain / Llamalndex / FastAPI 等
6.熟悉 Linux 开发环境
优先条件 (加分项)
具备以下经验之一优先:
·有大模型微调经验(LoRA/QLoRA/ SFT)
·有大模型推理部署经验(vLLM/TensorRT/Triton)
·有开源大模型使用经验:
· Qwen
· LLaMA
·DeepSeek
· ChatGLM
·有 Agent 开发经验
·有向量数据库使用经验
·有 AI产品落地经验
·有多GPU部署经验
与项目组成员有效沟通。
我们正在寻找一名热爱人工智能技术、具备大模型开发与落地能力的算法工程师,参与公司AI核心能力建设,
基于大语言模型(LLM)构建智能应用,推动产品智能化升级与创新。
工作时间:双休,8:30-17:30
薪资待遇:面议 (根据能力提供具有竞争力的薪资)
主要职责
1.大模型应用开发与优化
·基于主流大语言模型(如 GPT、Qwen、LLaMA、DeepSeek 等)开发业务应用
·设计并优化 Prompt Engineering、RAG(检索增强生成)、Agent 等系统
·提升模型在实际业务场景中的效果、稳定性和响应速度
2.模型微调与训练
·基于业务数据进行模型微调(SFT、LoRA、QLoRA 等)
·构建高质量训练数据集,优化模型表现
·参与模型评估体系设计与效果优化
3.推理优化与部署
·使用vLLM、TensorRT、ONNXRuntime 等推理框架部署模型
·优化模型推理性能,降低延迟和资源消耗
·支持 GPU 推理、量化、并发优化等工作
4.AI系统架构设计
·参与AI系统架构设计,包括模型服务、向量数据库、RAG系统等
·构建稳定、高可用的大模型服务架构
5.技术研究与创新
·跟踪大模型领域前沿技术(LLM、Agent、多模态等)
·探索新技术在公司产品中的落地应用
6.跨团队协作
·与产品、后端工程师协作,推动AI功能落地
·提供技术方案并参与产品设计
任职要求
必备条件
1.研究生及以上学历,计算机、人工智能、软件工程等相关专业
2.熟练使用 Python,具备良好的编程基础
3.熟悉至少一种深度学习框架:
·PyTorch (优先)
· TensorFlow
4。熟悉大语言模型相关技术:
· Prompt Engineering
·RAG架构
·向量数据库(Milvus / FAISS / Chroma/pgvector)
5.熟悉常用AI开发框架:
· LangChain / Llamalndex / FastAPI 等
6.熟悉 Linux 开发环境
优先条件 (加分项)
具备以下经验之一优先:
·有大模型微调经验(LoRA/QLoRA/ SFT)
·有大模型推理部署经验(vLLM/TensorRT/Triton)
·有开源大模型使用经验:
· Qwen
· LLaMA
·DeepSeek
· ChatGLM
·有 Agent 开发经验
·有向量数据库使用经验
·有 AI产品落地经验
·有多GPU部署经验
与项目组成员有效沟通。
工作地点
南昌红谷滩区置地中心2106

公司信息
公司介绍
江西金誉通信息技术有限公司是一家软件开发公司,致力于为广大高校提供优质的计算机软硬件产品及服务。我们深知高校对计算机技术的需求和期望,因此我们不断创新,研发出一系列适合高校使用的软件和硬件设备。我们的产品包括教学管理软件、实验室设备、网络设备等,旨在为高校提供高效、安全、稳定的信息化解决方案。同时,我们还提供专业的技术支持和服务,确保每一位客户都能得到及时、周到的帮助。我们的目标是成为高校信息技术领域的领导者,为教育事业的发展贡献力量。
工商信息
企业名称 江西金誉通信息技术有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 尹琳
经营状态 存续
成立时间 2022-01-24
注册资本 300万元
认证资质
营业执照信息

更新于 今天





