第一步、选择数据源

点击“导入已有文本”/“同步同步来自的Notion内容”
注意:同步来自的Notion内容(需要绑定Notion账号)

第二步、文本分段与清洗
1.分段设置

设置文本的分段规则、分段长度以及预处理规则等参数

  • “自动分段与清洗”可以自动设置分段规则与预处理规则,如果不了解分段规则和预处理规则建议选择此项
  • “自定义”可以自定义分段规则、分段长度以及预处理规则等参数

2.设置索引方式
  • “高质量”检索:调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度,但是需要花费Token
  • “经济”检索:使用离线的向量引擎、关键词索引等方式,降低了准确度但无需花费 Token
3.设置检索方法
  • 向量检索:通过生成查询嵌入并查询与其向量表示最相似的文本分段
  • 全文检索:索引文档中的所有词汇,从而允许用户查询任意词汇,并返回包含这些词汇的文本片段
  • 混合检索:同时执行全文检索和向量检索,并应用重排序步骤,从两类查询结果中选择匹配用户问题的最佳结果,需配置 Rerank 模型 API
第三步、处理文件创建知识库

点击“点击保存并处理”,完成知识库创建

作者:admin  创建时间:2024-04-26 09:39
最后编辑:admin  更新时间:2024-06-17 06:38