更新于 1月29日

大模型自动化评测专家-大模型数据服务中心

1.5-3万
  • 上海
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

岗位职责:
1、负责大模型自动化评测体系的建设与迭代,涵盖评测流程设计、指标体系制定、工具与平台开发,确保评测结果科学、稳定、可复用;
2、基于Agent与Workflow等先进技术,搭建自动化评测Pipeline,支持文本、多模态及AI应用的效果评估;
3、深入研究新型大模型评测方法与技术,制定科学合理的评测策略,推动评测体系的智能化与标准化,为模型优化提供有价值的反馈;
4、与研发团队紧密协作,将自动化评测体系嵌入模型训练与产品研发流程,形成评测与优化的闭环支持。
任职要求:
1、本科及以上学历,计算机科学、人工智能、计算语言学等相关专业优先;
2、掌握Python等编程语言,具备PE撰写调优、Agent/Workflow搭建实践经验优先;
3、具备1年以上大模型评测或相关经验,熟悉常见评测指标和方法,了解自动化评测工具或平台的开发与应用;
4、对大模型评测与优化充满热情,关注前沿研究动态,具备快速学习与持续探索能力;
5、思路清晰,逻辑性强,具备跨团队协作与沟通能力,能够在复杂项目环境中独立推进工作优先。

工作地点

中国大陆上海市徐汇区古美路1520号漕河泾中心D座,邮编:200233

职位发布者

王一帆/HRBP

昨日活跃
公司Logo字节跳动公司标签
字节跳动成立于2012年3月,公司使命为“Inspire Creativity, Enrich Life(激发创造,丰富生活)”。公司业务覆盖150个国家和地区,拥有15万名员工。字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、Lark、PICO、剪映、TikTok等。截至2021年6月,字节跳动旗下产品全球月活跃用户数超过19亿。
公司主页