Visual7W 图像数据

提供者:刘晓
下载地址:http://web.stanford.edu/~yukez/visual7w/

简介

Visual7W 图像数据是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering)任务,数据集中不仅包含图像本身,还包括图像内容的区域内容的问答。Visual7W是Visual Genome的一个子集,包含47,300张图像。Visual7W的问题主要由What, Where, How, When, Who,Why, and Which构成。Visual7W的问题是多选问题,每个问题都有四个候选答案。

文件类型

多文件压缩包

#文件大小
1.77Gb

相关论文

[1] Yuke Zhu, Oliver Groth, Michael Bernstein and Li Fei-Fei, Visual7W: Grounded Question Answering in Images