OceanBase 在 433 版本支持了向量数据类型,以支撑 AI 向量检索的相关应用。
目前,数据库存储系统与人工智能的融合应用主要有两个方向。
第一个应用方向是近似搜索,借助大语言模型(LLM,简称大模型)的嵌入(embedding)能力,将非结构化数据转化为向量数据存储到数据库系统中。数据库提供向量运算及近似度查询,实现搜索推荐、非结构化数据查询的应用。
第二个应用方向是检索增强生成。大模型具备自然语言对话、文本总结、智能体Agent、辅助编码等通用能力,但限于其预训练时使用有限知识,难以有效应对互联网平台源源不断涌现的海量知识。因此,常见的做法是使用数据库存储等问答语料并为大语言模型提供语料检索,即 RAG。
这里给大家推荐一篇由 @汪渺 写的一篇博客《OceanBase 向量功能:快速实现图搜图》。通过近似搜索应用架构,以一个简单的图搜图应用,来为大家展示 OceanBase 向量存储的能力。