Visual7W 图像数据

发表于 2018-05-11

提供者：刘晓
下载地址：http://web.stanford.edu/~yukez/visual7w/

简介

Visual7W 图像数据是一个图像内容理解的数据集，通过对图像区域的文字描述和互相之间的关联，进行视觉问答（Visual Question Answering）任务，数据集中不仅包含图像本身，还包括图像内容的区域内容的问答。Visual7W是Visual Genome的一个子集，包含47,300张图像。Visual7W的问题主要由What, Where, How, When, Who,Why, and Which构成。Visual7W的问题是多选问题，每个问题都有四个候选答案。

文件类型

多文件压缩包

#文件大小
1.77Gb

相关论文

[1] Yuke Zhu, Oliver Groth, Michael Bernstein and Li Fei-Fei, Visual7W: Grounded Question Answering in Images

CNLR

语料库、数据集及工具资源和教程

1. 简介
2. 文件类型
3. 相关论文