职位描述
自动化测试性能测试互联网
【岗位职责】
1、评测执行与数据运维:
(1)参与并执行既定的模型评测方案,涵盖效果、性能等多维度评测任务。
(2)负责评测数据集的准备、清洗、基础标注与日常维护,保障数据质量。
(3)编写清晰的操作文档与任务说明,确保评测过程标准化、结果可复现。
2、测试分析与问题跟进:
(1)独立负责模型迭代版本的功能回归与效果对比测试,熟练运用自动化脚本执行批量任务。
(2)对测试结果进行初步分析与问题定位,能从技术指标层面识别模型的能力波动与潜在缺陷。
(3)在他人指导下参与垂类业务模型的专项评测。
3、效率工具与自动化:
(1)在现有框架下,开发与维护自动化测试脚本,提升个人及小组的测试效率。
(2)参与团队CI/CD流程建设,协助将自动化评测集成至模型迭代流水线。
(3)积极探索并应用AI辅助测试工具,搭建工作流、知识库等,优化日常工作任务。
4、协作沟通与报告输出:
(1)与算法、工程团队密切协作,清晰汇报测试进展,积极跟进问题闭环。
(2)整理测试数据与过程,编写结构清晰、结论明确的模块测试报告与质量总结。
【任职要求】
1、基本条件:
(1)计算机科学、人工智能、软件工程或相关专业,本科及以上学历。
(2)具备1-3年软件测试、算法评测或数据评估相关经验。有AI模型(LLM/多模态)测试或实践项目经验者优先。
2、专业技能:
(1)模型理解:熟悉机器学习及深度学习基础原理,对大语言模型(LLM)的基本概念、应用及常见评测维度有基本了解。
(2)编程能力:熟练掌握Python,具备良好的编码习惯,能够独立编写测试脚本和进行数据处理。
(3)技术栈:了解至少一种主流深度学习框架(如PyTorch/TensorFlow)的基本使用;熟悉常见的测试框架或工具。
(4)评测基础:了解主流的模型评测方法与核心指标,能在指导下开展有效评测。
3、核心素质:
(1)执行力与责任心:工作细致严谨,对交付质量负责,能可靠地独立完成任务。
(2)分析与逻辑:具备良好的逻辑分析能力,能对测试现象进行初步归因,并主动排查。
(3)沟通与协作:拥有良好的团队合作精神和沟通意愿,能清晰表达问题,协同推进解决。
(4)学习与热忱:对AI技术抱有强烈兴趣,具备快速学习的能力,乐于探索新工具、新方法。
1、评测执行与数据运维:
(1)参与并执行既定的模型评测方案,涵盖效果、性能等多维度评测任务。
(2)负责评测数据集的准备、清洗、基础标注与日常维护,保障数据质量。
(3)编写清晰的操作文档与任务说明,确保评测过程标准化、结果可复现。
2、测试分析与问题跟进:
(1)独立负责模型迭代版本的功能回归与效果对比测试,熟练运用自动化脚本执行批量任务。
(2)对测试结果进行初步分析与问题定位,能从技术指标层面识别模型的能力波动与潜在缺陷。
(3)在他人指导下参与垂类业务模型的专项评测。
3、效率工具与自动化:
(1)在现有框架下,开发与维护自动化测试脚本,提升个人及小组的测试效率。
(2)参与团队CI/CD流程建设,协助将自动化评测集成至模型迭代流水线。
(3)积极探索并应用AI辅助测试工具,搭建工作流、知识库等,优化日常工作任务。
4、协作沟通与报告输出:
(1)与算法、工程团队密切协作,清晰汇报测试进展,积极跟进问题闭环。
(2)整理测试数据与过程,编写结构清晰、结论明确的模块测试报告与质量总结。
【任职要求】
1、基本条件:
(1)计算机科学、人工智能、软件工程或相关专业,本科及以上学历。
(2)具备1-3年软件测试、算法评测或数据评估相关经验。有AI模型(LLM/多模态)测试或实践项目经验者优先。
2、专业技能:
(1)模型理解:熟悉机器学习及深度学习基础原理,对大语言模型(LLM)的基本概念、应用及常见评测维度有基本了解。
(2)编程能力:熟练掌握Python,具备良好的编码习惯,能够独立编写测试脚本和进行数据处理。
(3)技术栈:了解至少一种主流深度学习框架(如PyTorch/TensorFlow)的基本使用;熟悉常见的测试框架或工具。
(4)评测基础:了解主流的模型评测方法与核心指标,能在指导下开展有效评测。
3、核心素质:
(1)执行力与责任心:工作细致严谨,对交付质量负责,能可靠地独立完成任务。
(2)分析与逻辑:具备良好的逻辑分析能力,能对测试现象进行初步归因,并主动排查。
(3)沟通与协作:拥有良好的团队合作精神和沟通意愿,能清晰表达问题,协同推进解决。
(4)学习与热忱:对AI技术抱有强烈兴趣,具备快速学习的能力,乐于探索新工具、新方法。
展开该职位详情




