MNIST数据集重生!测试图片增加到6万张,LeCun点赞
晓查 发自 凹非寺
量子位 出品 | 公众号 QbitAI

MNIST数据集是图像分类领域的基准测试之一,用于0~9手写数字图像分类任务,包含6万张训练图像和1万张测试图像。它已经有20多年的历史了。
但是官方测试集因为测试集样本太少,MNIST通常被认为不能提供有意义的置信区间。
现在,来自纽约大学两位研究人员给MNIST测试集再增加5万张图片,叫做QMNIST,获得校友、也是MNIST发起者LeCun转发。
LeCun给予了这个数据集很高的评价,认为它“重生、恢复、扩展”了MNIST。

数据集内容
QMNIST扩展数据集包含以下一些文件。

其中,前两个gz压缩文件和标准MNIST数据文件格式相同,不同的是QMNIST包含6万个测试样本。
前10000个QMNIST测试样本与MNIST测试集是逐一匹配的,后50000个示例是根据MNIST用算法重建的数据集。
使用方法
QMNIST的GitHub页上提供了Pytorch平台的QMNIST数据加载器,需要将数据集下载至与pytorch.py相同的文件夹下将网络下载选项设置为download=’True’。
它与标准的Pytorch MNIST数据加载器兼容。
from?qmnist?import?QMNIST
#?the?qmnist?training?set,?download?from?the?web?if?not?found
qtrain?=?QMNIST('_qmnist',?train=True,?download=True)??
#?the?qmnist?testing?set,?do?not?download.
qtest?=?QMNIST('_qmnist',?train=False)
#?the?first?10k?of?the?qmnist?testing?set?with?extended?labels
#?(targets?are?a?torch?vector?of?8?integers)
qtest10k?=?QMNIST('_qmnist',?what='test10k',?compat=False,?download='True')
#?all?the?NIST?digits?with?extended?labels
qall?=?QMNIST('_qmnist',?what='nist',?compat=False)
传送门
数据集地址:
https://github.com/facebookresearch/qmnist
论文地址:
https://arxiv.org/abs/1905.10498
— 完 —
小程序|全类别AI学习教程
AI社群|与优秀的人交流


量子位?QbitAI · 头条号签约作者
?'?' ? 追踪AI技术和产品新动态
喜欢就点「在看」吧 !
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平将发表二〇二六年新年贺词 7904141
- 2 2026年国补政策来了 7808738
- 3 东部战区:开火!开火!全部命中! 7712893
- 4 2026年这些民生政策将惠及百姓 7616985
- 5 小学食堂米线过期2.5小时被罚5万 7519709
- 6 解放军喊话驱离台军 原声曝光 7428214
- 7 为博流量直播踩烈士陵墓?绝不姑息 7327605
- 8 每月最高800元!多地发放养老消费券 7238391
- 9 数字人民币升级 1月1日起将计付利息 7141831
- 10 2026年1月1日起 一批新规将施行 7040675









量子位
