职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 参与大模型评测体系的设计与优化,协助制定评测指标和测试方案。
2. 执行大模型在多个任务场景下的评测,并收集并分析评测数据,输出结构化报告,为模型优化提供数据支持。
3. 协助搭建和维护评测工具链,提升评测效率与自动化水平。
岗位基本需求
1. 大学本科及以上学历,应用统计、数据科学、计算机、人工智能等相关专业优先。
2. 熟悉自然语言处理基础知识,了解主流大模型架构与应用场景。
3. 具备良好的逻辑分析能力和数据敏感度,熟练使用Python进行数据处理。
4. 工作认真负责,具备良好的沟通能力和团队协作精神。
岗位亮点
1. 深入接触前沿大模型技术,积累AI评测实战经验。
2. 与资深算法工程师紧密合作,快速提升技术视野与专业能力。