岗位职责:
1、负责构建并完善大模型评测体系(比如VLA自动驾驶模型,座舱智能交互助手等),包括评测标准制定,评测工具链开发,评测数据集构建;
2、基于业务需求设计评测方案,开展多维度模型评估,输出专业评测报告,对开源模型和工具进行调研与评测;
3、参与自动化评测体系算法研发及系统开发;
4、构建高水平Benchmark及评测方法。
岗位要求:
1、计算机科学/人工智能等相关专业硕士及以上学历;
2、精通Python编程,熟练掌握PyTorch/TensorFlow等深度学习框架;
3、熟悉大模型技术架构和性能分析,具备实际项目开发经验;
4、掌握大模型评测方法论,具备构建Benchmark或评测平台的实践,了解各类主流评测指标及其局限;
5、具备优秀的问题分析与解决能力,责任心强,具有良好的团队协作精神。