AI2科学问答数据集(多选)

提供者:刘唯
下载地址:https://www.kaggle.com/allenai/ai2-science-questions

简介

数据集概述

Allen Institute for Artificial Intelligence (AI2)的Project Aristo专注于构建一个系统,该系统能够获取并存储大量的可计算形式的知识,然后将这些知识应用于不同年级水平的学生的标准化考试中的各种科学问题。我们邀请更广泛的人工智能研究社区,通过提供学生科学评估问题的数据集,来与我们共同应对这一重大挑战。
这些都是英语语言问题,它跨越了文件中所显示的几个年级水平。每个问题都是对应4个选择回答。其中一些问题包括一个图表,作为问题文本的一部分,作为回答选项,或者两者兼而有之。图在文本中表示,文件名对应于对应文件夹中的图文件本身。这些问题被预先划分为培训、开发和测试集。
数据集包括以下字段:
questionID: a unique identifier for the question
originalQuestionID: the question number on the test
totalPossiblePoints: how many points the question is worth
AnswerKey: the correct answer option
isMultipleChoiceQuestion: 1 = multiple choice, 0 = other
includesDiagram: 1 = includes diagram, 0 = other
examName: the source of the exam
schoolGrade: grade level
year: year the source exam was published
question: the question itself
subject: Science
category: Test, Train, or Dev (data comes pre-split into these categories)

文件

大小:56MB

相关论文

1.Clark, Peter. “Elementary School Science and Math Tests as a Driver for AI: Take the Aristo Challenge!” AAAI (2015).