提供者:杜成玉
下载地址:http://yann.lecun.com/exdb/mnist/
概述
数据来源:https://www.zhihu.com/question/63383992/answer/222718972
机器学习领域内用于手写字识别的数据集,数据集中包含6个万训练集、10000个示例测试集。,每个样本图像的宽高为28*28。这些数据集的大小已经归一化,并且形成固定大小,因此预处理工作基本已经完成。在机器学习中,主流的机器学习工具(包括sklearn)很多都使用该数据集作为入门级别的介绍和应用。
数据集特征
数据来源:
数据存储在一个非常简单的文件格式中,用于存储向量和多维矩阵。数据集有4个文件:训练集图像、训练集标签、测试集图像和测试集标签。训练集包含60000例,测试集包括10000例。
相关论文
1.Ernst Kussul,Tatiana Baidyk. Improved method of handwritten digit recognition tested on MNIST database[J]. Image and Vision Computing,2004,22(12).
2.Migel D. Tissera,Mark D. McDonnell. Deep extreme learning machines: supervised autoencoding architecture for classification[J]. Neurocomputing,2016,174.
3.Theus H. Aspiras,Vijayan K. Asari. Hierarchical Autoassociative Polynimial Network (HAP Net) for pattern recognition[J]. Neurocomputing,2017,222.
4.陈蔼祥.用于字符和数字识别的若干分类方法的比较研究:实验结果[J].计算机科学,2015,42(S1):102-106+121.