职位描述:
(1)参与大模型应用场景的技术方案设计,结合具体业务提供算法层面的支持,协助产品团队定义功能边界与技术指标,推动技术方案落地。
(2)开展大模型预训练、微调策略研究,针对不同任务场景设计适配的训练流程,优化数据筛选、清洗与预处理方案,提升模型训练效率与效果。
(3)负责大模型的性能优化,在保证模型精度的前提下,降低模型显存占用与推理延迟,满足业务端低延迟、高并发的需求。
(4)协同多方团队,明确大模型服务的接口规范、数据交互格式与性能指标,推动模型服务与业务系统的无缝集成,确保上线前功能与性能达标。
(5)跟踪大模型领域的技术动态与研究成果,推动模型技术的持续迭代与创新,实现关键技术突破。
(6)开展技术分享与知识沉淀工作,整理大模型研发过程中的技术文档,定期在团队内部进行技术培训。
任职资格:
1.学历要求:硕士研究生及以上学历,计算机、人工智能相关专业优先。
2.工作经历:具备8年以上AI算法工作经验,熟练掌握Python或C/C++,并具有深度学习算法相关经验,了解国内外大模型演进及应用趋势,3年以上大模型相关经验者优先。
3.熟悉至少一种深度学习框架,如Pytorch、TensorFlow、JAX、PaddlePaddle或MindSpore,熟悉行业术语、流程和标准,可以提炼出模型真正需要解决的问题。
4. 精通多模态预训练模型架构设计开发、训练优化、行业大模型微调与知识库构建、领域知识融合、业务场景驱动的模型性能调优及高并发推理部署。
5.可快速理解业务痛点、数据特性和价值场景,具备跨行业知识迁移能力;具有政务、金融、交通、旅游、能源、电力等垂直行业工程落地经验者优先。
6.具有较强的沟通协调能力,面对问题能够灵活处理;具备较强的学习能力,有团队合作精神与较高的工作热情。