更新于 1月27日

搜索问答/文本评测/运营

9000-11000元
  • 成都武侯区
  • 1-3年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 人际关系好
  • 团队执行强
  • 氛围活跃
  • 免费班车
  • 管理人性化
  • 准时发工资

职位描述

大模型评测
岗位要求:
●本科及以上学历,专业不限。
●具备良好的文字理解与表达能力,逻辑思维清晰,具备较好的同理心和用户视角。
●工作认真细致、责任心强,具备较强的执行力和团队协作精神,能严格遵守评测标准和流程。
●具备基本的计算机操作能力,能熟练使用办公软件(如Excel、Word),有数据标注、模型评测相关经验者优先。
●对人工智能、大语言模型领域有一定兴趣,深度使用主流AI产品,并有自己的认知和见解;了解大模型的基本原理和技术框架。
岗位职责:
●负责各类大语言模型(LLM)通用能力的一线评测工作,包括但不限于文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心场景的效果验证。
●按照评测标准和流程,对模型输出结果进行客观、准确的打分与标注,记录评测过程中的异常情况和模型不足,形成详细的评测日志。
●参与构建自动评估集,完成题目构建、考点撰写、打分逻辑等任务。
●参与评测数据集的整理、清洗与标注工作,协助优化评测样本的覆盖度和代表性,提升评测数据的质量。
●配合团队完成评测任务的推进,及时反馈评测过程中遇到的问题(如评测标准模糊、样本异常等),协助优化评测方案和流程。
岗位要求:
1.大学本科及以上学历。语言学、文学、汉语言、心理学等专业,有基础的代码能力、数据处理能力者优先;
2.情商高,对AI对话产品有热情,对模型的文本表现力有自己的判断能力,能准确把握对话背后的语义、情感信息,在日常对交际中具备“高情商”素质者优先;
3.对AI行业有热情,使用过AI对话功能、对主流AI软件有自己的认知。豆包、claude等主流AI产品的功能重度使用者优先,有使用过coze等平台搭建workflow工作流经验者优先;
4.加分项:有大模型文本数据标注工作经历,熟悉大模型文本标注与评测方法,具备敏锐的数据感知能力和数据质量判断能力。
岗位职责:
1.承接文本类的大模型训练数据标注和评测数据标注工作(主要评测&标注内容包括:回复内容的准确性与有用性;对话的自然度与温度等),保障数据交付质量和进度;
2.构建高质量的语音类数据集与评测集,支持项目经理与产研团队定义数据评测和标注环节的理想态;
3.深刻理解对话类数据的交付需求,梳理并分析数据质量的问题并不断迭代优化,推动标注数据在模型训练中的运用。

工作地点

武侯区腾讯成都大厦

职位发布者

连小田/招聘经理

刚刚活跃
立即沟通
公司Logo软通动力信息技术(集团)股份有限公司公司标签
软通动力信息技术(集团)股份有限公司(以下简称“软通动力”)是中国领先的全栈智能化产品与服务提供商,2005年成立于北京,始终坚持创新,致力于成为一家具有全球影响力的科技企业。公司提供软件与数字技术服务、计算产品与智能电子、数字能源与智算服务以及国际化服务,员工90000人。目前,公司在10余个重要行业服务超过2600家国内外客户,其中超过230家客户为世界500强或中国500强企业。公司位列2024年中国 IT服务市场第一,入选2025年财富中国 500强企业,位列429。软通动力拥有软通咨询、软通金科、软通国际、软通工业互联、软通华方、机械革命、恒悦等业务子品牌,北京、江苏两大智能制造基地,布局北美、日韩、亚太、中东四大区域市场,在全球60余个城市构建完善的全球业务网络。公司锚定AI前沿,以人工智能工程能力为基础,科学智能(AI for Science)为引领,布局智能制造、ICT软硬基础能力和具身智能等领域,打造新产业链闭环,为客户提供场景智能(AIAgent)、终端智能(AI Terminal)、计算智能(AIInfra)的全栈智能服务。软通动力设立30个能力中心,拥有1个国家级工程实验室,6个省市政府认定的工程、技术实验室及研发中心,1个博士后科研工作站,依托全球软硬生态协同创新体系,不断探索前沿技术应用潜力。公司旗下教育品牌软通教育,拥有一家全日制本科学院——郑州西亚斯学院数字技术产业学院;全国合作院校700多所,设有70多个校企联合人才培养基地,通过校企合作、协同育人,为社会培养高素质应用型人才。软通动力先后荣获“2024新经济企业500强”、“2024年中国软件和信息技术服务竞争力百强企业”、“中国软件产业40年贡献企业”、“2024年信创领军企业”、“省级科技进步奖”,入选沪深300、中证A500、创业板50等核心指数,深交所信息披露最高“A”级评价,连续三年获得Wind ESG评级AA级等权威认可;拥有专利380+项、全球软件工程领域最高级别CMMI V2.0成熟度5级评估认证、信息系统建设和服务能力最高等级——杰出级(CS5)、信息技术服务标准(ITSS)运维能力成熟度一级认证等专业资质,支撑公司更优质的服务体系。
公司主页