Image captioning数据集、评价指标和算法性能比较

发布时间:2023年12月18日

Image captioning数据集、评价指标和算法性能比较

作者:安静到无声 个人主页

1 数据集

基于深度学习的图像描述算法能够得到迅速发展,很大成度得益于大规模数据集的出现。数据集不仅是衡量和比较图像描述算法性能的重要依据,也是将图像描述算法推向越来越复杂、越来越具有实用性方向的强大动力。图像描述领域常见的数据集有Flickr8K、Flickr30K、MicrosoftCOCOCaption、VisualGenome、ConceptualCap‐tions、TextCaps、VizWiz-Captions、LocalizedNarra‐tives和FAshionCaptioningDataset。

  1. Flickr8K 数据集由 UIUC(University of Illinois at Urbana-Cham
文章来源:https://blog.csdn.net/lihuanyu520/article/details/133466347
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。