岗位职责:
1、负责大模型的研究和应用,包括但不限于LLM、SFT、Agent/MultiAgent、 Tool Learning、RAG、RLHF等技术探索,研究前沿模型训练和优化方法,开发国际顶尖级大模型;
2、根据业务场景需求设计微调方案、适配算法和调优工程方案;
3、参与公司AI的行业大模型语料知识库建设和训练语料优化,知识图谱、知识FAQ、知识增强大模型等基础算法方向;
4、研究和跟踪前沿技术发展,探索AI在助力数字民生服务普惠和智能化方面的新方法和新范式,推动相关领域技术创新。
职位要求
1、计算机科学、人工智能、自然语言处理或相关专业领域;
2、具有大模型应用经验,丰富的深度学习经验,熟悉常见的深度学习框架(如TensorFlow、PyTorch等);
4、在预训练语言模型(如LLAMMA,GPT等)的设计、训练和优化方面有实际项目经验者优先;
5、出色的问题解决能力和创新能力,能够解决复杂的技术挑战;
6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;
7、良好的英文读写能力,能够阅读和理解相关的研究论文和文档;
8、发表过相关领域的学术论文或专利者优先。