简介

在推荐系统中,向量的最邻近检索是极为关键的一步,特别是在召回流程中。一般常用的如Annoy、faiss都可以满足大部分的需求,今天再来介绍另外一个:Milvus

Milvus不同于Annoy、faiss这类型的向量检索工具,它更是一款开源向量数据库,赋能 AI 应用和向量相似度搜索。

亮点

  1. Milvus不单单是向量检索工具,而是向量数据库,能对不同业务的向量隔离,分开存储;
  2. 提供可视化管理工具;
  3. 支持带过滤条件的向量混合检索。

    涉及的术语

  4. Filed:类似表字段,可以是结构化数据,当然还可以是向量;

  5. Entity:一组Filed,类似表的一条数据;
  6. Collection:一组Entity,类似于表;

    前言提示

    本文介绍的是官方最新版本2.x.x:https://milvus.io/cn/docs/v2.0.0/home,因为新增了许多强大的功能,所以尝鲜实验了一把。但2.x还在迭代中,并不是稳定版本。实验后,也发现存在一些问题,如有时无法查询,而1.x则不存在这些问题。

所以,大家实际使用最好是用最新的稳定版本1.1.1,不过缺少一些功能。https://milvus.io/cn/docs/v1.1.