职位描述
大模型算法深度学习机器学习PyTorchTensorFlowDEEPSPEEDPython大模型微调与蒸馏实战经验冷链或物流行业模型优化经验模型量化与边缘部署能力TransformerAttentionGPTBERT自然语言处理知识图谱XGBoost随机森林GBDT物联网人工智能货运物流
鲜生活冷链成立于 2016 年,为世界 500 强新希望集团旗下全资核心冷链平台,背靠集团全产业链资源,是国内头部冷链独角兽,全国冷链百强第 2,估值超百亿,获多家知名资本投资。业务覆盖全国多省市,仓储运力资源雄厚,旗下拥有运荔枝、集鲜两大核心品牌,主营全链路生鲜冷链供应链服务,一站式完成产地、仓储、干线、城配到门店全程冷链配送,平台实力强劲、发展稳定。
【岗位职责】
1、专注大语言模型(LLM)的微调(SFT、RLHF)、模型蒸馏、量化压缩技术研发与落地,聚焦冷链物流核心业务场景,设计适配冷链场景的模型微调和蒸馏方案,平衡模型性能、推理速度与部署成本。
2、主导大模型微调数据集的构建与优化,结合冷链物流业务数据(订单、温控、仓储、轨迹等),完成数据清洗、标注、增强,针对冷链行业痛点优化微调策略,提升模型在行业场景的适配性和准确率。
3、负责模型蒸馏、量化(INT8/INT4等)、剪枝等技术的研究与实现,优化模型体积和推理效率,满足冷链SaaS系统、边缘设备等不同部署场景的性能需求,降低部署成本。
4、跟踪大模型微调和蒸馏领域前沿技术(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特点进行技术预研和落地验证,推动技术转化为实际业务价值(如提升调度效率、降低货损、优化推理响应速度)。
5、与大模型算法、产品、工程团队紧密协作,提供微调和蒸馏技术支持,解决模型落地过程中的性能优化、兼容性等问题,确保模型高效部署到生产环境。
6、沉淀大模型微调和蒸馏的技术方法论、优秀实践,制定相关技术规范,推动团队技术能力提升,参与技术文档和测试标准的编写。
【任职要求】
1、本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业;硕士及以上学历、有相关顶会论文或开源项目经验者优先。
2、2年及以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经验,有完整的微调和蒸馏项目落地经验;有物流、供应链、冷链等行业模型优化经验者优先。
3、技术能力:精通Python编程语言,熟练掌握PyTorch、TensorFlow等深度学习框架,熟悉大模型微调工具(DeepSpeed、LoRA、QLoRA等)和蒸馏框架(TinyLlama、DistilBERT等)
4、专业知识:深入理解大模型底层原理、Transformer架构,熟练掌握模型微调、蒸馏、量化、剪枝等核心技术,能够独立设计并实现微调和蒸馏方案,解决实际技术痛点。
5、数据与工程能力:具备处理海量异构数据的经验,能够独立完成微调数据集的构建与优化;了解模型部署相关技术(Docker、K8s、vllm等),能够配合工程团队完成模型落地。
6、有冷链物流、供应链领域模型微调和蒸馏经验,熟悉仓储调度、路径优化、温控预警等业务场景,能够结合业务需求优化模型策略者优先。
7、有开源大模型(Qwen、LLaMA、GLM等)微调和蒸馏经验,熟练使用LoRA、QLoRA等高效微调技术,或有模型量化(GPTQ、AWQ等)实战经验者优先。
8、具备模型工程化落地经验,熟悉边缘设备部署、推理优化,能够将微调和蒸馏后的模型高效部署到生产环境者优先。
9、了解冷链SaaS系统、物流调度系统,具备较强的跨团队协作能力、问题解决能力和技术创新意识,对模型优化有强烈热情。
【岗位职责】
1、专注大语言模型(LLM)的微调(SFT、RLHF)、模型蒸馏、量化压缩技术研发与落地,聚焦冷链物流核心业务场景,设计适配冷链场景的模型微调和蒸馏方案,平衡模型性能、推理速度与部署成本。
2、主导大模型微调数据集的构建与优化,结合冷链物流业务数据(订单、温控、仓储、轨迹等),完成数据清洗、标注、增强,针对冷链行业痛点优化微调策略,提升模型在行业场景的适配性和准确率。
3、负责模型蒸馏、量化(INT8/INT4等)、剪枝等技术的研究与实现,优化模型体积和推理效率,满足冷链SaaS系统、边缘设备等不同部署场景的性能需求,降低部署成本。
4、跟踪大模型微调和蒸馏领域前沿技术(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特点进行技术预研和落地验证,推动技术转化为实际业务价值(如提升调度效率、降低货损、优化推理响应速度)。
5、与大模型算法、产品、工程团队紧密协作,提供微调和蒸馏技术支持,解决模型落地过程中的性能优化、兼容性等问题,确保模型高效部署到生产环境。
6、沉淀大模型微调和蒸馏的技术方法论、优秀实践,制定相关技术规范,推动团队技术能力提升,参与技术文档和测试标准的编写。
【任职要求】
1、本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业;硕士及以上学历、有相关顶会论文或开源项目经验者优先。
2、2年及以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经验,有完整的微调和蒸馏项目落地经验;有物流、供应链、冷链等行业模型优化经验者优先。
3、技术能力:精通Python编程语言,熟练掌握PyTorch、TensorFlow等深度学习框架,熟悉大模型微调工具(DeepSpeed、LoRA、QLoRA等)和蒸馏框架(TinyLlama、DistilBERT等)
4、专业知识:深入理解大模型底层原理、Transformer架构,熟练掌握模型微调、蒸馏、量化、剪枝等核心技术,能够独立设计并实现微调和蒸馏方案,解决实际技术痛点。
5、数据与工程能力:具备处理海量异构数据的经验,能够独立完成微调数据集的构建与优化;了解模型部署相关技术(Docker、K8s、vllm等),能够配合工程团队完成模型落地。
6、有冷链物流、供应链领域模型微调和蒸馏经验,熟悉仓储调度、路径优化、温控预警等业务场景,能够结合业务需求优化模型策略者优先。
7、有开源大模型(Qwen、LLaMA、GLM等)微调和蒸馏经验,熟练使用LoRA、QLoRA等高效微调技术,或有模型量化(GPTQ、AWQ等)实战经验者优先。
8、具备模型工程化落地经验,熟悉边缘设备部署、推理优化,能够将微调和蒸馏后的模型高效部署到生产环境者优先。
9、了解冷链SaaS系统、物流调度系统,具备较强的跨团队协作能力、问题解决能力和技术创新意识,对模型优化有强烈热情。
工作地点
成都锦江区火炬·动力港-A区

客户公司信息
客户公司名称 四川集鲜数智供应链科技有限公司
客户公司地址 成都锦江区四川省成都市锦江区三色路269号7栋四川集鲜数智供应链科技有限公司
客户公司人数 500-999人
认证资质
营业执照信息 人力资源服务许可证

更新于 今天





