向量检索返回结果比实际少很多

【 使用环境 】测试环境
【 OB or 其他组件 】oceanbase-ce
【 使用版本 】4.3.5.3
【问题描述】清晰明确描述问题
起初向量检索语句未走向量索引,查询数据符合实际的结果,但查询速度太慢,修改查询语句后可以走向量索引,但返回的结果少太多了。
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

向量检索返回结果数量少于预期的情况可能涉及多种因素,例如索引问题、配置问题或数据分布问题。我们可以先尝试通过 obdiag 工具来收集相关的诊断信息,从而进一步分析问题所在。

推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。
日志采集场景: SQL性能问题
日志采集命令: obdiag gather scene run --scene=observer.perf_sql --env “{db_connect=’-h127.0.0.1 -P2881 -utest@test -p****** -Dtest’, trace_id=‘Yxx’}”

请注意将上述命令中的 -h127.0.0.1 -P2881 -utest@test -p****** -Dtest 替换为您实际的数据库连接信息,并将 trace_id='Yxx' 替换为您的实际trace ID,这有助于我们更精确地定位问题。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 您可以描述一下具体的查询语句是什么吗?
  2. 在修改查询语句以使用索引之前,查询的结果与现在相比有什么显著的不同?
  3. 能否提供一个具体的数据示例,包括向量的维度、类型等信息?
  4. 您是否尝试过在生产环境或另一个测试环境中重现此问题?
  5. 能否查看并提供系统当前的配置参数,特别是与索引相关的设置?

这些信息对我们分析问题非常有帮助。期待您的回复。

附上敏捷诊断工具 obdiag 使用帮助链接

1 个赞

修改查询语句,是不是改语意了

哪里obdiag工具的详细教程

我要学习学习