Multimodal Contrastive Training for Visual Representation Learning

发布时间:2024年01月15日

在这里插入图片描述
parameterize the image encoder as f i q _{iq} iq?
在这里插入图片描述
query feature q i i _{ii} ii?,key feature k i i _{ii} ii?
parameterize the textual encoder as f c q ( ? ; Θ q , Φ c q ) f_{cq}(·; Θ_q, Φ_{cq}) fcq?(?;Θq?,Φcq?),momentum textual encoder as f c k ( ? ; Θ k , Φ i k ) f_{ck}(·; Θ_k, Φ_{ik}) fck?(?;Θk?,Φik?). c j ? c^?_j cj?? c j ? c^\star_j cj??是different augmented examples
在这里插入图片描述

吐槽

第一张图字母下标被黑色背景盖住了,且作者不公布代码,不该是CVPR的“水平”

文章来源:https://blog.csdn.net/qq_46221910/article/details/135601486
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。