职位描述
人工智能
一、岗位职责
1、专注大语言模型(LLM)的微调(SFT、RLHF)、模型蒸馏、量化压缩技术研发与落地,聚焦冷链物流核心业务场景,设计适配冷链场景的模型微调和蒸馏方案,平衡模型性能、推理速度与部署成本。
2、主导大模型微调数据集的构建与优化,结合冷链物流业务数据(订单、温控、仓储、轨迹等),完成数据清洗、标注、增强,针对冷链行业痛点优化微调策略,提升模型在行业场景的适配性和准确率。
3、负责模型蒸馏、量化(INT8/INT4等)、剪枝等技术的研究与实现,优化模型体积和推理效率,满足冷链SaaS系统、边缘设备等不同部署场景的性能需求,降低部署成本。
4、跟踪大模型微调和蒸馏领域前沿技术(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特点进行技术预研和落地验证,推动技术转化为实际业务价值(如提升调度效率、降低货损、优化推理响应速度)。
5、与大模型算法、产品、工程团队紧密协作,提供微调和蒸馏技术支持,解决模型落地过程中的性能优化、兼容性等问题,确保模型高效部署到生产环境。
6、沉淀大模型微调和蒸馏的技术方法论、优秀实践,制定相关技术规范,推动团队技术能力提升,参与技术文档和测试标准的编写。
1、专注大语言模型(LLM)的微调(SFT、RLHF)、模型蒸馏、量化压缩技术研发与落地,聚焦冷链物流核心业务场景,设计适配冷链场景的模型微调和蒸馏方案,平衡模型性能、推理速度与部署成本。
2、主导大模型微调数据集的构建与优化,结合冷链物流业务数据(订单、温控、仓储、轨迹等),完成数据清洗、标注、增强,针对冷链行业痛点优化微调策略,提升模型在行业场景的适配性和准确率。
3、负责模型蒸馏、量化(INT8/INT4等)、剪枝等技术的研究与实现,优化模型体积和推理效率,满足冷链SaaS系统、边缘设备等不同部署场景的性能需求,降低部署成本。
4、跟踪大模型微调和蒸馏领域前沿技术(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特点进行技术预研和落地验证,推动技术转化为实际业务价值(如提升调度效率、降低货损、优化推理响应速度)。
5、与大模型算法、产品、工程团队紧密协作,提供微调和蒸馏技术支持,解决模型落地过程中的性能优化、兼容性等问题,确保模型高效部署到生产环境。
6、沉淀大模型微调和蒸馏的技术方法论、优秀实践,制定相关技术规范,推动团队技术能力提升,参与技术文档和测试标准的编写。
薪资待遇:薪资15k-30k,
工作地址:成都市锦江区火炬动力港A区
工作时间:9:00—18:00
二、任职要求
1. 核心要求
· 学历:本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业;硕士及以上学历、有相关顶会论文或开源项目经验者优先。
· 经验:2年及以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经 验,有完整的微调和蒸馏项目落地经验;有物流、供应链、冷链等行业模型优化经验者优先。
· 技术能力:精通Python编程语言,熟练掌握PyTorch、TensorFlow等深度学习框架,熟悉大模型微调工具(DeepSpeed、LoRA、QLoRA等)和蒸馏框架(TinyLlama、DistilBERT等)。
· 专业知识:深入理解大模型底层原理、Transformer架构,熟练掌握模型微调、蒸馏、量化、剪枝等核心技术,能够独立设计并实现微调和蒸馏方案,解决实际技术痛点。
· 数据与工程能力:具备处理海量异构数据的经验,能够独立完成微调数据集的构建与优化;了解模型部署相关技术(Docker、K8s、vllm等),能够配合工程团队完成模型落地。
2. 加分项
· 有冷链物流、供应链领域模型微调和蒸馏经验,熟悉仓储调度、路径优化、温控预警等业务场景,能够结合业务需求优化模型策略者优先。
· 有开源大模型(Qwen、LLaMA、GLM等)微调和蒸馏经验,熟练使用LoRA、QLoRA等高效微调技术,或有模型量化(GPTQ、AWQ等)实战经验者优先。
· 具备模型工程化落地经验,熟悉边缘设备部署、推理优化,能够将微调和蒸馏后的模型高效部署到生产环境者优先。
· 了解冷链SaaS系统、物流调度系统,具备较强的跨团队协作能力、问题解决能力和技术创新意识,对模型优化有强烈热情。
1. 核心要求
· 学历:本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业;硕士及以上学历、有相关顶会论文或开源项目经验者优先。
· 经验:2年及以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经 验,有完整的微调和蒸馏项目落地经验;有物流、供应链、冷链等行业模型优化经验者优先。
· 技术能力:精通Python编程语言,熟练掌握PyTorch、TensorFlow等深度学习框架,熟悉大模型微调工具(DeepSpeed、LoRA、QLoRA等)和蒸馏框架(TinyLlama、DistilBERT等)。
· 专业知识:深入理解大模型底层原理、Transformer架构,熟练掌握模型微调、蒸馏、量化、剪枝等核心技术,能够独立设计并实现微调和蒸馏方案,解决实际技术痛点。
· 数据与工程能力:具备处理海量异构数据的经验,能够独立完成微调数据集的构建与优化;了解模型部署相关技术(Docker、K8s、vllm等),能够配合工程团队完成模型落地。
2. 加分项
· 有冷链物流、供应链领域模型微调和蒸馏经验,熟悉仓储调度、路径优化、温控预警等业务场景,能够结合业务需求优化模型策略者优先。
· 有开源大模型(Qwen、LLaMA、GLM等)微调和蒸馏经验,熟练使用LoRA、QLoRA等高效微调技术,或有模型量化(GPTQ、AWQ等)实战经验者优先。
· 具备模型工程化落地经验,熟悉边缘设备部署、推理优化,能够将微调和蒸馏后的模型高效部署到生产环境者优先。
· 了解冷链SaaS系统、物流调度系统,具备较强的跨团队协作能力、问题解决能力和技术创新意识,对模型优化有强烈热情。
工作地点
成都锦江区火炬·动力港-A区1

客户公司信息
客户公司名称 四川集鲜数智供应链科技有限公司
客户公司地址 成都锦江区四川省成都市锦江区三色路269号7栋四川集鲜数智供应链科技有限公司
客户公司人数 500-999人
认证资质
营业执照信息 人力资源服务许可证

更新于 今天




