职位描述
云计算软件/IT服务通信/网络设备
1.大模型全流程开发。负责基于TensorFlow、PyTorch等框架的大语言模型(LLM)全流程开发,包括监督微调(SFT)、奖励模型训练(RW)及强化学习优化(RLHF)。需优化模型在垂直领域的知识整合能力,解决训练中的过拟合/欠拟合问题,并通过动态调整学习率、混合精度训练等技术提升训练效率,实现跨模态语义对齐与协同推理能力;
2.分布式训练与国产化适配。使用DeepSpeed、Megatron-LM等主流框架实现千亿级参数模型的分布式训练(如数据并行、流水线并行),优化GPU显存占用与通信效率。针对主流国产硬件进行模型适配与调试,提升国产环境下训练吞吐量;
3.智能体与RAG系统构建。基于LangChain、Llama等主流框架开发智能体(Agent)系统,集成大模型与外部工具(如API、数据库)实现任务规划与自动化决策。通过检索增强生成(RAG)技术优化多模态数据检索策略(如向量索引、知识图谱),提升问答系统的实时性与准确性。构建面向政务、检务、医疗等垂直领域的行业知识增强框架,实现领域知识的高效注入与动态更新;
4.强化学习与多模态决策。应用DQN、PPO、SAC等算法优化智能体决策策略,结合扩散模型(Diffusion Policy)提升动态环境下的动作生成能力。设计多模态融合算法框架,提升在复杂场景下决策和推理能力。
2.分布式训练与国产化适配。使用DeepSpeed、Megatron-LM等主流框架实现千亿级参数模型的分布式训练(如数据并行、流水线并行),优化GPU显存占用与通信效率。针对主流国产硬件进行模型适配与调试,提升国产环境下训练吞吐量;
3.智能体与RAG系统构建。基于LangChain、Llama等主流框架开发智能体(Agent)系统,集成大模型与外部工具(如API、数据库)实现任务规划与自动化决策。通过检索增强生成(RAG)技术优化多模态数据检索策略(如向量索引、知识图谱),提升问答系统的实时性与准确性。构建面向政务、检务、医疗等垂直领域的行业知识增强框架,实现领域知识的高效注入与动态更新;
4.强化学习与多模态决策。应用DQN、PPO、SAC等算法优化智能体决策策略,结合扩散模型(Diffusion Policy)提升动态环境下的动作生成能力。设计多模态融合算法框架,提升在复杂场景下决策和推理能力。
工作地点
太原市-小店区-长风街132号

认证资质
营业执照信息

更新于 5月19日



