【圣诞三连抽!第二弹结果公布,看看你中奖了吗?】实战营(第三季)第九期 —— OceanBase 中的 AI Function

背景

现代数据库,在 “处理非结构化数据” 的能力上非常孱弱,这使得数据库只能存储这些数据而不能对这些数据进行计算处理,例如总结文本信息、提取图片特征信息等。

而大模型刚好具备这项能力。现实世界 80% 都是非结构化数据,如果能将大模型的能力融合进数据库内,将极大地简化用户从非结构化数据中获取含义的流程。

非结构化数据是指那些没有固定格式或结构不规则的数据,无法用传统关系数据库的二维表来表示。这些数据包括文本、图像、音频、视频等多种类型。

此外,现有向量数据库存在向量与其源数据转换脱节的问题。无论源数据是文本、图像还是其他数据,向量都可以视作源数据的另一种表示,是一种特殊的数据转换。但是在现有的 RAG 场景下,这种数据转换全部需要由用户手动完成。具体来讲,用户需要手动构建一系列复杂的 ETL(提取 → 加载 → 转换)管道,用于从原始数据库导出数据、对源数据进行分块、格式化、调用嵌入模型完成 embedding,最后保存到向量数据库。这种脱节问题的根源是向量数据库不具备嵌入能力。

支持和大模型的交互是将模型能力融入数据库的关键 “桥梁”,是目前向量数据库发展的一个重要特性。很多主流的数据库系统,为了集成大模型处理非结构化数据的能力以及支持 RAG 的闭环体验(即所有的数据处理都在一个数据库内完成),已经将调用模型的功能内置到数据库。最直观的功能体现是一条 SQL 调用大模型和创建索引时,可以在数据库内完成 embedding 数据转换,这种 SQL 调用大模型的功能被称为 AI Function。

边学边练,快乐无限

在本期课程中,AI Function 的研发同学风隼,会通过一个在线体验实验,让大家直接上手,快速了解 AI Function 的用法,以及感受 AI Function 的便捷性。

  • 在线实验地址:《OceanBase AI Function》

    说明 1:

    近期硅基流动的模型服务一直不太稳定,时常出现网络问题,如果遇到 error message 是 404 Not Found,推荐大家改用阿里云百炼的模型服务。

    下面会给出硅基流动、阿里云百炼、DeepSeek 的模型配置方式,需要大家自己去搞一个新用户免费试用的 API-Key~

    说明 2:

    在实验环境中,由于网络波动及系统负载较高,部分查询或系统函数的执行时间可能存在较大不确定性。为避免因偶发性延迟导致查询中断,临时把默认的超时时间从 10 秒调整到了 1000 秒。

    实验环境的网络带宽极小,因此该设置仅适用于当前实验环境。在正常的本地或生产环境中,此类操作通常在毫秒级即可完成,无需设置如此大的超时值。

  • 课后小测地址:【DBA 实战营】AI Function

    • 在第三季的活动中,每通过一个课后练习,就会自动获得 10 个社区积分,并获得一次抽奖的资格。抽奖时有机会获得实体礼物或更高额的积分奖励。

    • 第三季课后小测,为了避免您等待人工审核,在最后一道问答题中,需要复制黏贴一个您在实验环境中通过 obclient -h127.0.0.1 -P2881 -uroot@mysql_tenant -A -Dtest 链接到数据库后,执行 select now(), GetKey('你的论坛用户名'); 后获取的字符串。

    • 例如您的社区用户名叫作兹拉坦,需要复制黏贴到最后一道问答题中的字符串就是:02095F4E60B29E8B709DB2773B18FDCB6E1365817C (不要截图,只需要复制黏贴字符串后上传到最后一道题的答题区域中即可)。

      obclient [test]> select GetKey('兹拉坦');
      +--------------------------------------------+
      | GetKey('兹拉坦')                            |
      +--------------------------------------------+
      | 02095F4E60B29E8B709DB2773B18FDCB6E1365817C |
      +--------------------------------------------+
      1 row in set (0.001 sec)
      

      小提示:

      1. 需要先登录 OceanBase 账号,才能初始化屏幕右边的实验环境进行实验。
      2. 在实验环境里,干什么都可以。大家不要受限于屏幕左边的实验手册,可以天马行空地做一些你感兴趣的事情,或者验证一些你对 OceanBase 官网文档的疑问、以及自己的猜想等等。
      3. 欢迎大家平时在学习 OceanBase 的过程中,也都能充分利用在线体验页面为您提供的一些实验环境,来体验 OceanBase 中您感兴趣的新特性。

希望大家都能够积极参与上面的在线体验,并通过课后小测。这是 OceanBase 社区能够持续为大家更新《DBA 实战营(第三季)》课程内容的最大动力~

OB-min

23 个赞

实战营课程《AI Function》传送门

在线体验《AI Function》传送门

课后小测《AI Function》传送门

本期活动福利

通过本次课后小测的用户

  • 会自动获得 OceanBase 社区为大家提供的 10 积分奖励,并会自动获得一次抽奖机会。

  • 在本期课程在上线一周之后,我们将在通过这期课后小测的用户中,随机抽取 5 位,分别获得:

    • OceanBase 专属正版乐高积木 * 1。



    • OceanBase 成立之后,服务的第一个对象,就是淘宝的收藏夹业务。因为临近淘宝双十二,所以本期课程的福利是 OceanBase 数据库首个用户 —— “淘宝” 纪念款手办(共四种不同款式,盲盒中是其中的随机一款)+ “淘宝特价版” 的吉祥物 —— 萝卜特手办 * 1(两个手办,独宠一名通过课后小测的幸运用户)~



      image

    • OceanBase 专属瓷杯 * 1。



    • 《OceanBase 源码解析》电子书兑换码 * 1(电子版)。



    • 200 社区积分 * 1。


  • 双十二特刊的更多惊喜福利:
    • 最近 @兹拉坦 十分沉鉴宝节目,开始转型国宝帮,收集了一些瓷器。
      • 所以只要通过第九期课程课后小测的人数超过 100,就会再额外加抽一个纯手工打造的 “景德镇 x 阿里巴巴” 手作瓷杯一个。



      • 如果这期课程通过考试的人数能超过 150 人,就再额外加抽 —— 丙午年天涯共举杯新春礼盒一个。其中包含 “景德镇 x 阿里巴巴” 高白泥高温淬炼真金铭文的烤金瓷杯一对儿,外加徽章、对联、福字、红包等春节物品若干~

这次加抽的两个礼物都是瓷杯,也是希望各位老师,慈悲为怀,大发慈悲,多多通过课后小测,让第三季的实战营活动能够顺利结课,不被腰斩~

中奖结果公布后,中奖者请添加 OB 社区小助手微信:OBCE666,并说明中奖信息。OB 社区小助手在 7 个工作日内会将礼物为您寄出。如果 7 个工作日内没有找小助手领取,视为自动放弃本次的奖品。

OceanBase 社区会保证本次活动抽奖流程的公平公正,“因为信任,所以简单”。

手办盲盒因为是盲盒,所以款式随机,望大家理解。

加抽的礼物,如果发不出去,就又要成为 @兹拉坦 的私人收藏喽~ :joy:

通过结课考试福利

通过第三季全部十期课后小测的同学,会自动获得参加结课考试的资格。

  • 通过结课考试后,可以获得 OceanBase DBA 实战营(第三季)的结课证书。获取社区教程证书后,系统还会自动为您增加 60 积分。即完成第二季实战营课程,您可以获得 160 积分!

  • 除此以外,前 100 位通过本次结课考试,并获取课程结课证书的的同学,可以获得 OBCA 考试券 * 1 / OBCP 2.5 折折扣券 * 1(二选一)。


圣诞三连抽!第二弹抽奖结果公布,看看你中奖了吗?

第九期课程上线后,共有 78 名用户通过课后练习。我用代码随机生成 5 个 1 ~ 78 内不重复的数字 N,分别代表在所有通过课后小测的用户中,第 N 个注册 OceanBase 账号的用户可以获得对应的奖品。

OceanBase 社区会保证本次活动抽奖流程的公平公正,“因为信任,所以简单”。

  1. @小迷 (第 70)—— 获得 OceanBase 专属正版乐高积木 * 1

  2. @bicewow (第 9)—— 二十周年纪念版淘公仔 * 1 + “淘宝特价版” 的吉祥物 —— 萝卜特手办 * 1

  3. @hc (第 2)—— 获得 OceanBase 定制款马克杯 * 1

  4. @Bingxiao (第 1)—— 获得《OceanBase 源码解析》电子书兑换码 * 1

  5. @Lunara(第 22)—— 获得 200 社区积分

恭喜以上各位!

中奖者请添加 OB 社区小助手微信:OBCE666,并说明中奖信息。
OB 社区小助手在 7 个工作日内会将礼物为您寄出。如果 7 个工作日内没有找小助手领取,视为自动放弃本次的奖品。

第十期课程(物化视图)明天抽奖,设置了额外加抽的礼物,详见:

(12.26 抽奖) 第十期 —— OceanBase 物化视图(通过考试的人数只要能超过 100 / 125 / 150 人,就再额外加抽淘宝闪购起手物资、人民文学出版社四大名著衍生礼品、正版 AC 米兰 25 ~ 26 赛季的主场球迷版队服)

福利:【12.26 抽奖】实战营(第三季)第十期 —— OceanBase 物化视图(12.29 开启结课考试,通过结课考试即可获得 OBCA / OBCP 考试券)

小测:OceanBase 社区

下周一(12.29)上午十点,即将开启实战营(第三季)的结课考试,希望获得 OBCA / OBCP 考试券的老师们,欢迎关注和参与。通过第三季全部十期课后小测的老师们,就会自动获得参加结课考试的资格,大家抓紧最后一周的时间,赶紧通过课后小测哈~

实战营(第三季)活动详情:【12 月 29 日上午 10:00 开启结课考试】OceanBase 实战营(第三季),通过考试,获取 OBCA / OBCP 考试券!

18 个赞

实战营课程《AI Function》传送门

在线体验《AI Function》传送门

硅基流动的大模型服务近几天一直有问题,大家还是去用阿里云百炼的吧~

各个模型服务商内部,同种能力的模型,可以选择的种类也有很多。

以下给出的模型类型,只是通过阿里云百炼的模型服务创建和使用 AI MODEL 的示例,便于大家快速上手体验,并不是唯一选择。大家可以按需进行调整。

AI_COMPLETE

call DBMS_AI_SERVICE.DROP_AI_MODEL ('ali_complete');
call DBMS_AI_SERVICE.DROP_AI_MODEL_ENDPOINT ('ali_complete_endpoint');

call DBMS_AI_SERVICE.CREATE_AI_MODEL(
'ali_complete', '{
    "type": "completion",
    "model_name": "qwen-plus"
  }');

call DBMS_AI_SERVICE.CREATE_AI_MODEL_ENDPOINT (
'ali_complete_endpoint', '{
    "ai_model_name": "ali_complete",
    "url": "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions",
    "access_key": "sk-xxxxxxxxxxxx",
    "provider": "aliyun-openAI"
  }');

select ai_complete("ali_complete","1+1=?");

AI_EMBED

call DBMS_AI_SERVICE.DROP_AI_MODEL ('ali_embed');
call DBMS_AI_SERVICE.DROP_AI_MODEL_ENDPOINT ('ali_embed_endpoint');

call DBMS_AI_SERVICE.CREATE_AI_MODEL(
'ali_embed', '{
    "type": "dense_embedding",
    "model_name": "text-embedding-v4"
  }');

call DBMS_AI_SERVICE.CREATE_AI_MODEL_ENDPOINT (
'ali_embed_endpoint', '{
    "ai_model_name": "ali_embed",
    "url": "https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings",
    "access_key": "sk-xxxxxxxxxxxx",
    "provider": "ALIYUN-OPENAI"
  }');

select ai_embed("ali_embed","老虎");

AI_RERANK

call DBMS_AI_SERVICE.DROP_AI_MODEL ('dash_rerank');
call DBMS_AI_SERVICE.DROP_AI_MODEL_ENDPOINT ('dash_rerank_endpoint');

call DBMS_AI_SERVICE.CREATE_AI_MODEL(
'dash_rerank', '{
    "type": "rerank",
    "model_name": "gte-rerank-v2"
  }');

call DBMS_AI_SERVICE.CREATE_AI_MODEL_ENDPOINT (
'dash_rerank_endpoint', '{
    "ai_model_name": "dash_rerank",
    "url": "https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank",
    "access_key": "sk-xxxxxxxxx",
    "provider": "ALIYUN-dashscope"
  }');

select ai_rerank("dash_rerank","Apple",'["apple","banana","fruit","vegetable"]');

课后小测《AI Function》传送门

24 个赞

期待

27 个赞

不知不觉第三季接近尾声了

29 个赞

666

29 个赞

快结束了,好好加油

28 个赞

加油加油

29 个赞

:+1: :+1: :+1:

30 个赞

666

30 个赞

打卡

26 个赞

加油,坚持就是胜利!

21 个赞

学而时习之,不亦说乎!

21 个赞

第一第一

18 个赞

中奖中奖

16 个赞

冲冲冲

17 个赞

点赞

17 个赞

学学学

11 个赞

加油

15 个赞

一起努力

16 个赞