岗位职责
1.大语言模型性能优化:开展大语言模型增量预训练与微调技术研究,提升模型在特定领域和任务上的性能表现,任务场景包含但不限于代码生成、知识问答、文本生成等;
2.基于大模型的智能体开发:构建能够自主学习和决策的智能体,以解决复杂问题,如实时任务规划、动态事件响应等;
3.面向垂直领域的检索增强生成:基于文本、图片、网页、数据库、知识库等多源异构领域数据,开展嵌入模型构建、向量数据库优化、召回重排序等技术研究,提升大模型在互联网信息挖掘、领域知识问答等的时效性和专业性;
4.基于垂直领域业务场景、MCP协议框架、大模型开展Agent研发;
5.参与团队协作和项目管理,与跨部门成员合作,共同推进大模型项目的研发、实施和优化,确保项目目标的实现。
任职要求:
1.硕士及以上,计算机科学与技术、软件工程、人工智能、数学等相关专业;
2.熟悉大模型预训练、微调、应用主流算法和常用工具,具备较强的算法实现和软件开发能力;
3.熟悉Python编程,熟悉TensorFlow、PyTorch等主流深度学习框架;
4.深入理解自然语言处理(NLP)、强化学习、计算机视觉、大语言模型(如GPT,GLM)等相关算法原理及应用;
5.具备跨领域学习能力,有较强的逻辑思维、交流沟通能力;能够自我驱动,有强烈的责任感和团队协作意识。
加分项:
1.有在顶级会议或期刊发表论文者优先;
2.熟悉langchain、llamaIndex等开源框架者优先;
3.有模型微调、知识图谱、智能体开发处理经验者优先。