职位描述
大模型算法PyTorchTensorFlow
岗位职责:
(1)领域语料库体系构建:负责规划、设计并落地面向特定业务领域的大规模、高质量语料库建设;
(2)垂类模型微调与落地:精通模型微调与领域适配技术,对基座大模型进行高效微调(LoRA/QLoRA/全量微调)。主导从数据清洗、指令微调数据构建、模型训练到部署上线的全流程,确保模型在准确率、幻觉率和推理性能上满足生产环境要求;
(3)强化学习与对齐优化:设计贴合业务场景的奖励模型(Reward Model),运用强化学习(RLHF/PPO/DPO)优化模型输出,解决专业领域“幻觉”问题,使其符合医疗伦理规范与工业严谨性标准;
(4)前沿技术探索与转化:主动跟踪LLM领域最新进展(如微调框架、长文本外推、模型压缩),将前沿论文转化为可落地的技术方案,持续提升团队技术天花板;
(5)评估体系建设与迭代:建立并完善垂类场景的自动化评测体系,不仅关注Loss,更关注业务指标(如诊断准确率、参数采纳率)。基于bad cases制定数据策略及模型优化方案,形成高效迭代闭环。
任职要求:
(1)计算机、人工智能、数学或相关专业硕士及以上学历;
(2)熟练掌握Python及主要数据处理库(Pandas, NumPy等),具备扎实的编程能力。 熟悉至少一种主流深度学习框架(PyTorch / TensorFlow);
(3)具备大规模文本语料处理经验,理解数据质量对模型的关键影响,有成熟的数据治理方法论,并能独立完成清洗、增强及指令微调数据构建 ;
(4)具备大语言模型的实际微调项目经验,熟悉全参数微调、LoRA等主流微调技术及工具;
(5)有垂类大模型微调项目的实战落地经验,医疗或工业领域优先。
优先考虑:
(1)具备芯片、工业和医疗等行业大模型相关经验,熟悉大模型的核心架构、基础原理及训练方法,在大模型训练、微调、部署、应用等方面有丰富实操经验
(2)熟悉检索增强生成(RAG)知识图谱和向量数据库性能调优等技术,并能将其与微调策略结合。
工作地点
南京浦口区未来数字谷A座14层

公司信息
公司介绍
紫光云技术有限公司成立于2018年,作为中国领先的政企客户云服务提供商,是新紫光集团唯一云计算业务主体,拥有广泛的政企市场实践和覆盖全国的云资源交付能力,致力于为政企客户提供全栈、全域、全场景的云计算解决方案。紫光云提供“芯、网、云、数、智”纵向打通的全栈能力,以IaaS服务为基础,不断向PaaS、SaaS、+SaaS延伸,提供“云+数字化”产品与解决方案,以温暖感、专业化的服务,7x24小时护航“建云、上云、用云、管云、咨询、安全”全链条云服务。现已建立超千人的专家队伍和研发体系,覆盖天津、重庆、成都、甘肃、烟台、沈阳、曲靖、连云港、朝阳等地,其政务云服务、智慧城市的建设和运营已在全国30余个省,200余个地市实现落地,在金融、医疗、交通、教育、建筑、工业、水利等行业云市场拥有10000+客户实践。
工商信息
企业名称 北京紫光云技术有限公司
企业类型 有限责任公司(自然人投资或控股的法人独资)
法人代表 刘云峰
经营状态 存续
成立时间 2019-07-30
注册资本 100万元
认证资质
营业执照信息

更新于 5月8日





