向量数据库

向量数据库相关的节点。 向量数据库与普通数据库不太一样,其重点在于可以对数据进行快速的相似性查询。比如你的数据库里有两条数据分别是:
  • 西红柿炒鸡蛋
  • 滑蛋牛肉
这时用户来询问:鸡蛋炒西红柿怎么做?传统的数据库如果不经过分词等特殊处理是无法直接查询到数据库里的西红柿炒鸡蛋这条数据的。而向量数据库则可以通过数据的相似性直接查询到这条数据。 数据在存储到向量数据库之前,需要经过特殊的处理,这个处理过程就是向量化。所以查询的过程就是匹配数据的向量之间的相似性。 使用向量查询有一个好处是我们可以通过特定的向量化方法,将相同含义的内容归类到一起,包括但不限于各种语言、图片、视频、音频。比如我们可以将所有的猫的图片向量化,然后通过向量查询,就可以将所有的猫的图片都查询出来。又或者是输入中文的查询文字,向量查询可以把英文里语义相关的内容也找出来。

添加数据

向量w - 图1

通过工作流的方式将数据添加到向量数据库中。

参数详解

1. 标题

这条数据的标题文字。

2. 文本

这条数据的内容文字。

3. 来源网址

这条数据的来源网址,如果有可能建议加上,因为数据在存储时是不含格式的,如果需要查看原始数据,可以通过这个网址来查看。

4. 分割方法

文本处理中的文本分割方法相同。 额外的 表格分割 方法是将每一行拆分,并为每一行添加一个表头。 例如,我们有以下的 csv 文本:
  1. csv
  2. Year,Datetime,Stage,Stadium,City
  3. 1930.0,13 Jul 1930 - 15:00 ,Group 1,Pocitos,Montevideo
  4. 1930.0,13 Jul 1930 - 15:00 ,Group 4,Parque Central,Montevideo
  5. 1930.0,14 Jul 1930 - 12:45 ,Group 2,Parque Central,Montevideo
如果我们使用 表格分割 方法,数据将被拆分成以下 3 段数据:

<font style="color:rgb(31, 35, 40);">Year: 1930.0 Datetime: 13 Jul 1930 - 15:00 Stage: Group 1 Stadium: Pocitos City: Montevideo</font>

<font style="color:rgb(31, 35, 40);">Year: 1930.0 Datetime: 13 Jul 1930 - 15:00 Stage: Group 4 Stadium: Parque Central City: Montevideo</font>

<font style="color:rgb(31, 35, 40);">Year: 1930.0 Datetime: 14 Jul 1930 - 12:45 Stage: Group 2 Stadium: Parque Central City: Montevideo</font>

5. 分割长度

文本处理中的文本分割长度相同。

6. 数据类型

目前支持文本类数据,后期会添加图片、视频、音频等数据类型。

7. 数据库

选择要添加数据的数据库。 注意:在使用这个工作流节点之前,请务必在数据管理页面中创建一个数据库。

输出类型

<font style="color:rgb(31, 35, 40);">字符串</font>

表示添加的这个数据在数据库中的ID,可用于后期的删除等操作。

积分消耗

本节点暂时不消耗积分。

删除数据

向量w - 图2

通过工作流的方式将数据从向量数据库中删除。

参数详解

1. 数据对象ID

要删除的数据对象ID,可以通过添加数据节点获取。

2. 数据库

数据所在的数据库。

输出类型

<font style="color:rgb(31, 35, 40);">布尔值</font>

<font style="color:rgb(31, 35, 40);">True</font>表示删除成功,<font style="color:rgb(31, 35, 40);">False</font>表示删除失败。

积分消耗

本节点暂时不消耗积分。

搜索数据

向量w - 图3

通过工作流的方式搜索数据。

参数详解

1. 搜索文本

要搜索的文本。

2. 数据类型

目前仅支持文本类数据,后期会添加图片、视频、音频等数据类型。

3. 数据库

数据所在的数据库。

4. 搜索结果数量

搜索结果的数量,返回多少条与搜索文本相关的数据。

5. 输出类型

  • 文本 - 以文本形式返回搜索结果。 - 如果有多条搜索结果,会用换行符合并。
  • 列表 - 以列表形式返回搜索结果。

输出类型

<font style="color:rgb(31, 35, 40);">字符串</font><font style="color:rgb(31, 35, 40);">列表</font>,根据输出类型参数决定。

积分消耗

本节点暂时不消耗积分。