更新于 3月18日

搜索问答大模型评测(外派腾讯)

7000-11000元
  • 成都武侯区
  • 1-3年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 人际关系好
  • 免费班车
  • 管理人性化
  • 团队执行强
  • 交通便利

职位描述

语音标注文本标注人工智能计算机软件
岗位职责:
●负责各类大语言模型(LLM)通用能力的一线评测工作,包括但不限于文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心场景的效果验证。
●按照评测标准和流程,对模型输出结果进行客观、准确的打分与标注,记录评测过程中的异常情况和模型不足,形成详细的评测日志。
●参与构建自动评估集,完成题目构建、考点撰写、打分逻辑等任务。
●参与评测数据集的整理、清洗与标注工作,协助优化评测样本的覆盖度和代表性,提升评测数据的质量。
●配合团队完成评测任务的推进,及时反馈评测过程中遇到的问题(如评测标准模糊、样本异常等),协助优化评测方案和流程。
岗位要求:
●本科及以上学历,专业不限。
●具备良好的文字理解与表达能力,逻辑思维清晰,具备较好的同理心和用户视角。
●工作认真细致、责任心强,具备较强的执行力和团队协作精神,能严格遵守评测标准和流程。
●具备基本的计算机操作能力,能熟练使用办公软件(如Excel、Word),有数据标注、模型评测相关经验者优先。
●对人工智能、大语言模型领域有一定兴趣,深度使用主流AI产品,并有自己的认知和见解;了解大模型的基本原理和技术框架。

工作地点

成都武侯区腾讯大厦

认证资质

营业执照信息

职位发布者

连文超/招聘主管

当前在线
立即沟通
公司Logo上海微创软件股份有限公司
上海微创软件股份有限公司2002年由微软与上海市政府共同创办,是微软在华投资的第一家合资公司。微创始终秉承高标准的服务品质与“成就客户”的服务理念,在全球设有20余处交付中心,分布在中国、美国、日本、澳大利亚,凭借在汽车、保险、高科技、金融、互联网等行业的深厚积累和丰富经验,与2500余家企业与政府客户达成了长期、稳定、友好的合作。
公司主页