Q-BENCH: A BENCHMARK FOR GENERAL-PURPOSEFOUNDATION MODELS ON LOW-LEVEL VISION

发布时间：2024年01月10日

继续分享Q系列文章，今天分享Q-BENCH。

简单来说，作者对MLLMs在lowlevel领域中的评价提出了一个测试基准，主要分三点进行讲述。

有点类似于综述，显然作者团队在MLLM的lowlevel领域属于开山之作了。

第一个基准叫感知Perception

简单来说，Perception就是模型对语言文本评价的回答，yes or no。high or low。等等二分类或者多分类的回答。

第二个基准叫做Description

Description就是对图像内容的评价，后面作者在Q-instruct中提出了这种回答的基准，更加规范了模型的回答。

第三个基准叫做Assessment

Assessment就是模型直接对图片的打分评价，0-100分。

这三个基准如上图abc还是比较好理解的。

文章来源:https://blog.csdn.net/qq_40962125/article/details/135413754
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！