“除了向量数据库外,我是否还需要一个普通的 SQL 数据库?”
这是我们经常被问到的一个问题。如果除了向量数据以外,用户还有其他标量数据信息,那么其业务可能需要在进行语义相似性搜索(https://zilliz.com.cn/glossary/%E8%AF%AD%E4%B9%89%E6%90%9C%E7%B4%A2-%EF%BC%88semantic-search%EF%BC%89)前先根据某种条件过滤数据,例如:
在法律领域,可能只需要从某个特定数据库中搜索相关的法律条款;
在零售业,可能需要搜索某个尺码的男鞋;
在图像搜索时,可能希望搜索 2010-2016 年上映且 IMDB 电影评分高于 7.0 的电影的海报。
对此,我们的答案是——不需要。用向量数据库 Milvus Cloud或全托管的 Milvus 服务——Zilliz Cloud,就无需额外再维护一个 SQL 数据库存储标量了。只要一个系统,用户便可起送实现“向量搜索+标量过滤”的混合查询,从而获取更精准的搜索结果。
其中,Milvus(https://zilliz.com/what-is-milvus)允许用户在进行向量搜索时依据标量数据进行条件过滤,数据属性可以是除向量以外的任何字段。Milvus 会对向量字段创建向量索引并进行向量相似性搜索,与此同时,还可以通过表达式对搜索结果进行元数据过滤。只需在搜索时输入过滤表达式,Milvus 就会帮你自动进行这两种操作。
本教程使用