关于seekdb版块


OceanBase seekdb 是 OceanBase 打造的一款开发者友好的 AI 原生数据库产品,专注于为 AI 应用提供高效的混合搜索能力。它支持向量、文本、结构化与半结构化数据的统一存储与检索,并通过内置 AI Functions 支持数据嵌入、重排与库内实时推理。

seekdb 在继承 OceanBase 核心引擎高性能优势与 MySQL 全面兼容特性的基础上,通过深度优化数据搜索架构,为开发者提供更符合 AI 应用数据处理需求的解决方案。

欢迎大家在这个板块中,讨论一切和 seekdb 有关的问题!

GitHub 地址:https://github.com/oceanbase/seekdb,也欢迎大家 star 这个项目!

:fire: 为什么选择 OceanBase seekdb?


特性 OceanBase seekdb OceanBase MySQL 9.0 Chroma Elasticsearch DuckDB Milvus PostgreSQL
+pgvector
嵌入式数据库 :white_check_mark:支持 :x: 不支持 :x: 不支持(8.0移除) :white_check_mark:支持 :x: 不支持 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持
单机数据库 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持
分布式数据库 :x: 不支持 :white_check_mark:支持 :x: 不支持 :x: 不支持 :white_check_mark:支持 :x: 不支持 :white_check_mark:支持 :x: 不支持
MySQL 兼容 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :x: 不支持 :white_check_mark:支持 :x: 不支持 :x: 不支持
向量搜索 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持
全文检索 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :warning: 有限 :white_check_mark:支持
混合搜索 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :white_check_mark:支持 :warning: 有限
OLTP :white_check_mark:支持 :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :x: 不支持 :x: 不支持 :x: 不支持 :white_check_mark:支持
OLAP :white_check_mark:支持 :white_check_mark:支持 :x: 不支持 :x: 不支持 :warning: 有限 :white_check_mark:支持 :x: 不支持 :white_check_mark:支持
开源协议 Apache 2.0 MulanPubL 2.0 GPL 2.0 Apache 2.0 AGPLv3
+SSPLv1
+Elastic 2.0
MIT Apache 2.0 PostgreSQL License

:sparkles: 核心特性

开箱即用,极速开发,易学易用

采用单点架构设计,可快速完成安装配置;无其他组件依赖,单点启动即可运行,适用于 AI 业务敏捷开发场景。提供灵活多样的部署方式,支持服务器和嵌入式两种部署模式:服务器部署模式下,支持 yum install、docker 或 Windows/macOS 桌面版部署方式;嵌入式部署模式下,支持原生 Python 集成,可作为 AI 应用内嵌数据库。已集成各类 AI 应用开发框架,几分钟即可快速构建 AI 应用。

支持 1C2G 小规格,垂直弹性扩缩容

1 核 CPU + 2GB 内存即可运行 VectorDBBench Performance1536D50K 基准测试。当系统对并发量、数据量、查询复杂度有较高要求时,可灵活垂直扩展资源规格。

高性能向量索引、全文索引,支持向量、全文、标量混合搜索

  • 向量搜索:支持高达 16,000 维向量存储与高性能检索,兼容 L2、内积、余弦相似度等多种距离计算方式。提供 HNSW/IVF 索引及相关量化算法,支持精确最近邻及近似最近邻搜索,满足 AI 场景多样化的向量检索需求。
  • 全文搜索:支持基于 BM25 相关性排序算法的高性能全文索引,实现面向关键词的精准搜索。提供 Space、Beng、Ngram、IK、Jieba 等多种分词器,支持 Natural Language Mode、Boolean Mode、Phrase Query、Multi Match 等多种查询模式,可在海量数据中高效检索符合过滤规则的相关文本。
  • 混合搜索:支持向量、全文、标量、空间等多类数据的混合搜索,一条 SQL 即可完成多路查询与重排序,大幅提升 RAG 应用查询结果的准确性。

向量搜索升级,基于 Semantic Index 指定文本也可进行语义搜索

seekdb 提供了 Semantic Index 功能,只需写入文本数据,系统即可自动进行 Embedding 并生成向量索引,查询时仅需指定文本搜索条件即可进行语义搜索。该功能对用户屏蔽了向量嵌入和查询结果 Rerank 的复杂流程,显著简化 AI 应用开发对数据库的使用方式。

无缝对接各类模型,内置 AI Function 实现库内实时推理

seekdb 支持大语言模型和向量嵌入模型接入,通过 DBMS_AI_SERVICE 系统包实现模型注册和管理。内置 AI_COMPLETE、AI_PROMPT、AI_EMBED、AI_RERANK 等 AI Function,支持在标准 SQL 语法下进行数据嵌入和库内实时推理。

基于 JSON 的动态 Schema,支持文档元数据动态存储和高效访问

seekdb 支持 JSON 数据类型,具备动态 Schema 能力。支持 JSON 的部分更新以降低数据更新成本,提供 JSON 函数索引、多值索引来优化查询性能。实现半结构化编码降低存储成本。在 AI 应用中,JSON 可作为文档元信息的存储类型,并支持与全文、向量的混合搜索。

数据实时写入,实时可查

基于 LSM-Tree 存储架构,seekdb 支持数据的高频实时写入。在执行数据 DML 操作时同步构建全文、向量、标量等各类索引,数据入库成功后立即可查。

兼容 MySQL 不止于 MySQL,支撑 HTAP 混合负载

深度兼容 MySQL 的语法、协议、数据字典等,确保 MySQL 应用无缝迁移。同时通过创新架构突破 MySQL 支持的场景边界,基于行列混存技术和向量化执行能力,一个实例可同时支持联机交易和实时分析等多种负载,省去数据同步的时间延迟和同步链路的维护成本。

2 个赞