职位描述
岗位职责:
1、负责提升大模型“智商”,全链路(包含Pretrain、SFT、RLHF等)提升大模型的模型效果;
2、持续跟踪业界前沿研究进展,和团队一起建立深入广泛的领域技术认知,推动研究成果实际落地,产生广泛影响力;
3、深度参与到探索项目,探索大模型数据生产方法和数据形式,实现大模型能力的突破。
任职要求:
1、本科及以上学历,自然语言处理、计算机、数学、理工科等专业优先;
2、熟悉NLP、CV相关的算法和技术优先,熟悉大模型训练、SFT、RL算法者优先;
3、创新能力比较强,对于不断探索新的AI技术和应用场景有强烈意愿和主观能动性;
4、具有出色的分析、解决问题的能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力者优先;
5、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
查看全部