更新于 2月13日

算法测试工程师

1.5-2.5万
  • 北京西城区
  • 天桥
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

大模型算法人工智能云计算/大数据
岗位职责
1. 主导NLP模型全维度测试,针对BERT/GPT等微调模型,覆盖文本生成、实体识别、文本分类等核心任务,设计科学评测方案并验证模型准确率、召回率等关键指标;
2. 专项负责AI提示词测试,设计多场景提示词用例(含歧义性、复杂指令、多轮交互等),验证提示词与模型交互的精准性、鲁棒性及场景适配性;
3. 开展算法大模型性能测试,聚焦推理延迟、吞吐量、资源消耗(CPU/GPU/内存)、高并发稳定性等核心指标,设计压测方案并实施验证;
4. 负责AI系统核心模块及全链路测试,涵盖RAG知识库(知识抽取、向量存储/检索)、生成类功能等,验证模块协同准确性与流程闭环性;
5. 分析测试过程中的模型缺陷、性能瓶颈及提示词适配问题,输出精准测试报告与优化建议,协同开发/算法团队推动问题闭环;
6. 沉淀NLP模型全维度测试、提示词测试及大模型性能测试方法论,构建标准化测试用例库与数据集,提升测试效率与覆盖度。

任职要求
1. 计算机、AI、NLP、数据科学等相关专业本科及以上学历;
2. 熟悉Python+Linux技术栈,具备扎实的测试理论基础与用例设计能力;
3. 深入了解NLP核心技术与Transformer架构,熟悉BERT/GPT等大模型原理及微调、推理流程;
4. 具备AI测试实战经验,熟练掌握NLP模型全维度测试、AI提示词测试及算法大模型性能测试核心方法,能独立完成测试全流程;
5. 熟悉主流性能测试工具(JMeter/Locust等),了解向量数据库(ChromaDB/Milvus)使用与测试方法者优先;
6. 3年以上测试经验,含1年以上AI/NLP或大模型相关测试经验,有全链路测试经验者优先;
7. 具备较强的系统思维、逻辑分析能力及跨团队协作能力,能快速定位复杂测试问题;
8. 加分项:熟悉模型评测指标(F1/BLEU等);具备OCR+NLP多模态测试经验;了解ONNX/TensorRT等推理加速技术;有招投标领域系统测试经验者优先。

工作地点

北京西城区南纬路31号

职位发布者

孙女士/人事专员

三日内活跃
立即沟通
公司Logo北京国金汇德工程管理有限公司
北京国金汇德工程管理有限公司成立于2011年,是一家以信息化项目咨询为主的专业咨询公司,高新技术企业、专精特新企业。主要业务涉及信息化项目评审、财务收支审计、造价咨询、跟踪审计、标准编制、资产评估、软件开发、专业培训等方面。为客户提供综合的、一体化、全生命周期的解决方案。公司已实现审计流程、审核依据、交付成果的数字化,是国家标准编制单位、信息化概(预)算定额主编单位、信息化项目审计领军企业。公司总部设立在北京,全国已成立21家分公司,17个办事处,遍及全国各个省份,为客户提供优质高效、可持续增值的专业化服务。目前公司博士、硕士占比10%,拥有各类专业技术证书逾400个,软件著作权68项和技术专利1项,建立了以专业技术为支撑,高学历、职业化的综合咨询人才梯队。经过十余年的发展和积累,公司客户遍及全国各地,被众多政府部门和大型企事业单位选聘为信息化项目咨询服务机构。创立十余年来,累计送审信息化项目金额近千亿,极大的为客户提高了资金使用效率、有效的控制了建设流程风险、保障了项目的实施质量,提升了项目管理标准。公司始终秉持着“诚信、责任、专业、共赢”的企业价值观,坚持党建引领企业发展,持续为客户提供专业、优质、高效的服务。在十余年的发展历程中与客户建立了长期互利共赢的合作关系,赢得了客户、员工及社会各方面的一致好评。
公司主页