工作职责
1. 主导大模型场景下关键词匹配全链路算法研发,覆盖关键词提取、同义词挖掘、语义相似度计算等模块,融合传统技术与向量检索提升匹配泛化能力。
2. 针对智能检索、内容审核等业务场景设计算法解决方案,围绕准确率、召回率等核心指标优化模型,解决高频词干扰、低频词覆盖不足等落地问题。
3. 搭建大模型与关键词匹配系统的协同架构,利用大模型增强语义理解,同时通过关键词匹配优化模型输入输出,结合量化技术降低算力成本。
4. 构建关键词匹配专用数据集与评估体系,负责数据标注、清洗及质量管控,通过数据分析定位算法瓶颈并指导迭代。
5. 跟踪前沿技术(如零样本关键词提取),沉淀可复用工具与最佳实践,推动团队研发效率提升。
6. 跨团队协同输出技术方案,配合完成算法工程化部署,解决高并发场景下的性能瓶颈,保障系统稳定运行。
任职要求
1. 本科及以上学历,计算机、人工智能等相关专业,优秀本科生需3年以上核心项目经验并提供成果证明。
2. 3-5年大模型或深度学习算法经验,有LLM微调、RAG系统搭建经验者优先。
3. 精通机器学习与NLP核心理论,深入掌握关键词提取、向量检索等算法,理解Transformer架构及大模型语义原理。
4. 熟练使用Python及PyTorch/TensorFlow框架,熟悉Hugging Face、Sentence-BERT、Faiss/Milvus等工具链。
5. 具备工程化思维,能独立完成算法实现与部署,了解分布式检索、高并发处理技术。
6. 能快速转化业务需求为算法方案,有智能检索、内容推荐等领域关键词匹配落地经验者优先,熟悉工程/化工行业特性加分。