AI 知识库（RAG）

AI 知识库，基于 RAG 方式，实现 LLM 打通内部知识库。

疑问：什么是 RAG？

目前，项目中的 AI 聊天对话功能，已经接入 AI 知识库，如下图所示：

AI 知识库的案例

整个功能，涉及到 3 个表：

表关系图

ai_knowledge：AI 知识库表
ai_knowledge_document：AI 知识库文档表
ai_knowledge_segment：AI 知识库段落表

下面，我们逐个表进行介绍，这个过程中也会讲讲对应的功能。

1. AI 知识库表

ai_knowledge 表，是 AI 知识库的主表，存储了知识库的基本信息。

1.1 表结构

省略 creator/create_time/updater/update_time/deleted/tenant_id 等通用字段

CREATE TABLE `ai_knowledge` (
  `id` bigint NOT NULL AUTO_INCREMENT COMMENT '编号',
  `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '知识库名称',
  `description` longtext COLLATE utf8mb4_unicode_ci COMMENT '知识库描述',
  
  `embedding_model_id` bigint NOT NULL COMMENT '向量模型编号',
  `embedding_model` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '向量模型标识',
  
  `top_k` int NOT NULL COMMENT 'topK',
  `similarity_threshold` double NOT NULL COMMENT '相似度阈值',

  `status` tinyint NOT NULL COMMENT '是否启用',

  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='AI 知识库表';

① embedding_model_id 字段：对应 ai_model 表的 id 字段，表示使用的向量模型。

友情提示：向量模型的配置，可见「附录：向量模型」小节。

② top_k 字段：表示检索时，返回的最大数量。

similarity_threshold 字段：表示相似度阈值，超过这个值，检索才会返回。

1.2 管理后台

① 前端对应 [AI 大模型 -> AI 知识库] 菜单，对应 yudao-ui-admin-vue3 项目的 @/views/ai/knowledge/knowledge 目录，创建知识库。

AI 知识库

它的后端 HTTP 接口，由 yudao-module-ai 模块的 model 包的 AiKnowledgeController 实现。

② 点击「新建」按钮，填写知识库名称、描述、向量模型、topK、相似度阈值，点击「保存」按钮，即可创建知识库。如下图所示：

AI 知识库新建

2. AI 知识库文档表

ai_knowledge_document 表，是 AI 知识库的文档表，存储了知识库的文档信息。

2.1 表结构

省略 creator/create_time/updater/update_time/deleted/tenant_id 等通用字段

CREATE TABLE `ai_knowledge_document` (
  `id` bigint NOT NULL AUTO_INCREMENT COMMENT '编号',
  `knowledge_id` bigint NOT NULL COMMENT '知识库编号',
  `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '文档名称',
  
  `url` varchar(1024) COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '文件 URL',
  `content` text CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '内容',
  `content_length` int NOT NULL COMMENT '字符数',
  `tokens` int NOT NULL COMMENT 'token 数量',
  
  `segment_max_tokens` int NOT NULL COMMENT '分片最大 Token 数',
  
  `retrieval_count` int NOT NULL DEFAULT '0' COMMENT '召回次数',
  
  `status` tinyint NOT NULL COMMENT '是否启用',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=23 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='AI 知识库文档表';

① knowledge_id 字段：对应 ai_knowledge 表的 id 字段，表示属于哪个知识库。

② url 字段：通过上传文件，新建文档时，会有文件 URL。

content、content_length、tokens 字段：表示文档内容、字符数、token 数量。

③ segment_max_tokens 字段：表示分片最大 Token 数，超过这个值，会进行分片。目前通过 Spring AI 提供的 TokenTextSplitter 进行分片。

④ retrieval_count 字段：表示召回次数，每次检索时，会记录召回次数。

2.2 管理后台

① 点击“知识库”所在列的「文档」按钮，进入该知识库的文档列表，对应 yudao-ui-admin-vue3 项目的 @/views/ai/knowledge/knowledge 目录，如下图所示：

AI 知识库文档

它的后端 HTTP 接口，由 yudao-module-ai 模块的 model 包的 AiKnowledgeDocumentController 实现。

② 点击「新建」按钮，上传文件（支持多个），不断点击「下一步」按钮，即可创建文档。如下图所示：

AI 知识库文档新建

AI 知识库文档新建2

AI 知识库文档新建3

完成后，文档会被切成多个分片，之后分片使用【向量模型】进行向量化，最终存储到【向量存储】中。

友情提示：向量存储的配置，可见「附录：向量存储」小节。

3. AI 知识库段落表

ai_knowledge_segment 表，是 AI 知识库的段落表，存储了知识库的段落信息。

也就是说，切片一方面存储到【向量存储】中（用于“检索”），另一方面存储到 ai_knowledge_segment 表中（用于“管理”）。

3.1 表结构

省略 creator/create_time/updater/update_time/deleted/tenant_id 等通用字段

CREATE TABLE `ai_knowledge_segment` (
  `id` bigint NOT NULL AUTO_INCREMENT COMMENT '编号',

  `knowledge_id` bigint NOT NULL COMMENT '知识库编号',
  `document_id` bigint NOT NULL COMMENT '文档编号',
  
  `content` text CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '分段内容',
  `content_length` int NOT NULL COMMENT '字符数',
  `tokens` int NOT NULL COMMENT 'token 数量',

  `vector_id` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci DEFAULT NULL COMMENT '向量库的编号',

  `retrieval_count` int NOT NULL DEFAULT '0' COMMENT '召回次数',
  
  `status` tinyint NOT NULL COMMENT '是否启用',

  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=183 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='AI 知识库分段表';

① knowledge_id 字段：对应 ai_knowledge 表的 id 字段，表示属于哪个知识库。

document_id 字段：对应 ai_knowledge_document 表的 id 字段，表示属于哪个文档。

② content、content_length、tokens 字段：表示分段内容、字符数、token 数量。

③ vector_id 字段：表示向量库的编号，对应【向量存储】中的向量编号。只做关联，不存储向量值。

④ retrieval_count 字段：表示召回次数，每次检索时，会记录召回次数。

3.2 管理后台

① 点击“文档”所在列的「文档」按钮，进入该知识库的文档列表，点击「查看」按钮，即可查看文档的分段列表，对应 yudao-ui-admin-vue3 项目的 @/views/ai/knowledge/knowledge 目录，如下图所示：

AI 知识库段落

② 除了上述文档的方式，我们也可以点击「新建」或者「编辑」按钮，手动创建或编辑段落。如下图所示：

AI 知识库段落新建

4. 如何使用？

4.1 召回测试

可以在 [AI 大模型 -> AI 知识库] 菜单，点击“知识库”所在列的「召回测试」按钮，输入检索内容，即可测试知识库的检索。如下图所示：

AI 知识库召回测试

4.2 接入 AI 聊天

① 第一步，在角色配置时，关联对应的 AI 知识库，可多选。如下图所示：

AI 知识库角色配置

② 第二步，使用该角色进行聊天，即可使用 AI 知识库。如下图所示：

AI 知识库的案例

5. 如何 Rerank 重排序？

疑问：为什么 Rerank 可以提升 RAG 效果？

目前 Spring AI 暂时没有提供 Rerank 功能，目前只有 Alibaba AI 提供了 RerankModel 。

也因此，如果想使用 Rerank 功能，目前只能使用 DashScopeRerankModel 实现类，对应《阿里云 —— 文本排序》。使用的话，只需要修改 application.yml 中，配置如下内容：

spring:
  ai:
    dashscope: # 通义千问
      api-key: sk-47aa124781be4bfb95244cc62f6xxxx # 注意：需要改成你的 apiKey ！！！！
    model:
      rerank: dashscope # 是否开启“通义千问”的 Rerank 模型，填写 dashscope 开启

修改完，可以调试 AiKnowledgeSegmentServiceImpl 类的 #searchKnowledgeSegment(...) 方法。

附录：向量模型

在 Spring AI 中，通过 EmbeddingModel 接口，实现了各个平台的向量模型的接入。如下图所示：

EmbeddingModel 实现

目前在项目的 AiModelFactoryImpl 中，提供了 #getOrCreateEmbeddingModel(...) 方法：

已实现 OllamaEmbeddingModel、DashScopeEmbeddingModel 模型的接入
未实现的其它平台的向量模型，可参考实现到上述方法中

OllamaEmbeddingModel

① 首先，访问 https://ollama.ai/download ，下载对应系统 Ollama 客户端，然后安装。

② 然后，访问 https://ollama.com/search?c=embedding 地址，获取想运行的向量模型。

例如说：nomic-embed-text，则可在命令中执行 ollama pull nomic-embed-text 命令，进行一键部署。

③ 最后，在 [AI 大模型 -> 控制台 -> 模型配置] 菜单，添加该向量模型。

注意，模型名使用你 Ollama 部署的模型名。