Skip to content

Commit 0d5b29b

Browse files
authored
Update 11、MaxKB.mdx
1 parent 92ca815 commit 0d5b29b

File tree

1 file changed

+5
-1
lines changed

1 file changed

+5
-1
lines changed

docs/pages/11、MaxKB.mdx

Lines changed: 5 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -25,10 +25,14 @@ MaxKB 企业级智能体平台秉持开源开放的核心理念,积极拥抱
2525
检索增强生成(RAG)管道作为 MaxKB 企业级智能体平台的核心技术架构,通过多阶段精细化处理构建了数据与模型的协同闭环。该管道首先依托高精度检索模块从海量企业知识库中精准定位相关上下文,随后通过语义增强层对检索内容进行结构化重组与逻辑校验,最终将经过验证的信息注入大模型生成环节。这一创新机制不仅有效抑制了传统大模型因数据依赖不足导致的“幻觉”输出,更通过实时知识校准确保回答的准确性与业务适配性,为企业构建了可信、可控、可溯源的智能体决策链路。其主要涉及以下几方面:
2626
- **多源知识库摄取**: MaxKB 支持多种知识库的无缝导入。对于通用型知识库,它支持直接拖拽或选择多种文件格式进行上传,包括 TXT、Markdown、PDF、DOCX、HTML、XLS、XLSX、CSV 和 ZIP 等 。此外,它还支持针对 Web 站点知识库进行自动化爬取,用户只需输入文档 URL 地址和选择器,即可同步知识库内容。
2727
- **全自动文档处理**: 文档摄取后,知识库的自动化处理流程将按照以下步骤进行处理:
28+
2829
○分段(Segmentation): 系统将根据内置的智能分段规则对文档内容进行自动分段拆分,针对格式不规范或分段要求复杂的文档也可以切换到高级分段通过自定义规则进行复杂文档拆分。分段完成后可以预览分段效果,预览时也支持用户手动分段,以确保内容分段符合预期。
29-
○向量化(Vectorization): 分段后的文本通过向量模型(Embedding Model)进行向量化,向量化过程将文档转换为高维向量,并存储在专门的向量数据库(如:PostgreSQL)中 。这一过程是 RAG 管道中相似度检索的基石,它使得系统能够将向量化后的用户问题基于语义在知识库中进行高效的相似度检索,而非简单的关键词匹配。
30+
○向量化(Vectorization): 分段后的文本通过向量模型(Embedding Model)进行向量化,向量化过程将文档转换为高维向量,并存储在专门的向量数据库(如:PostgreSQL)中 。这一过程是 RAG 管道中相似度检索的基石,它使得系统能够将向量化后的用户问题基于语义在知识库中进行高效的相似度检索,而非简单的关键词匹配。
31+
3032
- **命中处理模式**mei sh: MaxKB 提供了两种灵活的命中处理方式,以适应不同的问答需求:
33+
3134
○模型优化(Model Optimization): 当用户的提问命中知识库中的分段时,系统会根据预先设定的应用提示词,将检索到的分段内容与用户问题一同发送给大模型进行优化,并由大模型生成最终答案 。这种方式适用于需要大模型进行推理、归纳和总结的复杂问答场景。
35+
3236
○直接回答(Direct Answer): 如果相似度符合设定标准,系统将直接返回命中的分段内容作为答案 。该模式特别适用于需要返回原文内容、图片或链接等精确信息的场景,例如公司制度查询、产品规格手册检索等,确保答案的准确性和信息完整性。
3337

3438
### 11.3.2.灵活的工作流编排与工具调用

0 commit comments

Comments
 (0)