工作内容:
1、参与文本数据的无监督、有监督数据构建方法设计,包括但不限于标注规范设计、数据预处理、提示词调优,与算法、工程、业务团队合作,保障数据生产方案合理性2、跟进行业大模型数据工程最新技术动态,通过数据底层理论剖析、先进工具引入、Prompt工程等途径持续迭代完善数据生产方案,持续提升数据质量和生产效率,保障数据生产方案处于行业领先水平
职位要求:
1.本科及以上学历,面向语言学、理工科、计算机等广泛专业,语言学与计算机类交叉专业优先2、对大模型有基本的了解,具备良好的行业洞察力及优质数据鉴赏力,对大模型数据集的优劣评价、资源方案有自己的认知3、对各行各业有良好的知识储备、并拥有强烈的兴趣
4、沟通表达及工作条理性强,拥有快速的学习能力
5、责任心强,有团队意识,具有良好抗压能力
6、具有一定的python编程能力、AI模型训练及提示词调优相关经验优先