feat-query-expansion-hyde.md 1.9 KB

测试用例 - 检索增强 (Query Expansion & HyDE)

1. 功能概述

本功能通过“查询扩展(Query Expansion)”和“假设性文档嵌入(HyDE)”提升检索的相关性,特别是针对短查询或跨语言查询。

2. 测试场景与结果

场景 A: 查询扩展 (Query Expansion)

  • 测试步骤:
    1. 在设置中开启“查询扩展”。
    2. 输入查询: "RAG アーキテクチャ 意味と仕組み"。
    3. 查看后台日志中生成的扩展查询。
  • 验证结果:
    • 日志显示: [RagService] Generated query variations: RAGの基本的な定義と構成要素 | 検索増強生成の仕組みとメリット | LLMと外部知識の統合プロセス
    • 检索执行: 系统针对这几个变体分别执行了 Elasticsearch 检索并成功合并结果。
  • 结论: 通过

场景 B: HyDE (Hypothetical Document Embeddings)

  • 测试步骤:
    1. 在设置中开启 "HyDE"。
    2. 输入同样的查询。
    3. 查看日志中生成的假设性文档。
  • 验证结果:
    • 日志显示: [RagService] Generated HyDE document: RAG(Retrieval-Augmented Generation)は、大規模言語モデル...
    • 检索执行: 系统基于生成的长段落执行了向量搜索,提升了语义匹配度。
  • 结论: 通过

场景 C: 重排序 (Rerank) 与阈值问题

  • 测试步骤:
    1. 开启 Rerank。
    2. 检查得分较低(如 0.528)的结果是否能成功返回。
  • 验证结果:
    • 初始版本: 结果被 similarityThreshold (0.7) 过滤。
    • 修复后: 系统识别到使用了 Rerank,自动应用 scoreThreshold (0.5),结果成功返回。
    • 日志显示: Results after filtering (threshold 0.5, usedRerank=true): 1 / 1 items
  • 结论: 通过

3. 最终状态

  • 设置面板开关生效
  • 多级检索逻辑正确
  • 结果合并与消重逻辑
  • Rerank 阈值解耦逻辑
  • 前端国际化配置