es检索之复合检索

发布时间：2023年12月22日

背景：向量检索是文本相似度检索，现在增加新的字段进行过滤，如果以filter方式进行过滤，那么最终结果不保证有topK个，甚至一个都没有，因为它是先进行topK个向量召回，再进行filter。

当然有人建议采用scriptScore方式进行检索，但此方式可能造成请求压力过大，内存消耗。

scriptScore方式如下：

POST my_index/_search 
 { 
   "size":2, 
   "query": { 
   "script_score": { 
       "query": { 
         "match_all": {} 
       }, 
       "script": { 
         "source": "vector_score", 
         "lang": "vector", 
         "params": { 
           "field": "my_vector", 
           "vector": [1.0, 2.0], 
           "metric": "euclidean" 
         } 
       } 
     } 
   } 
 }

相关python代码如下：



query_json = {
                    "size": k,
                    "_source": {"include": ["

文章来源:https://blog.csdn.net/SPESEG/article/details/135132824
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！