为什么 InfMnist (MNIST) 大小的 8M 个示例计算为 8 109 999 个示例?
Why InfMnist (MNIST) size of 8M examples is calculated as 8 109 999 examples?
在网站上:
http://leon.bottou.org/projects/infimnist
它说:
正在生成包含 MNIST8M 训练集的文件:
$ infimnist 实验室 10000 8109999 > mnist8m-labels-idx1-ubyte
$ infimnist pat 10000 8109999 > mnist8m-patterns-idx3-ubyte
但是,我不明白为什么它从 10 000 到 8 109 999
即使我这样做:8 109 999 - 10 000,它对我来说仍然没有意义。
对我来说 8M 将是 8 000 000 + 9 999,因为我将以 9 999 结束并从 10 000 开始到 8 009 999,这将是 800 万张图像。
有谁知道为什么计算为 8 109 999 吗?
根据一位 kaggle 用户的说法,这就是为什么:
8M数据集是原始图片+134distortions/original。所以有
135*60,000 = 8,100,000
训练图像。
将 10,000 张测试图像相加得到 8,110,000 张图像。
测试图像从索引 0 到 10,000-1=9,999,训练图像从索引 10,000 到 8,110,000-1 = 8,109,999。
希望对您有所帮助。
原始数据集也在这里:
https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html
您可以看到“# of data: 8,100,000”
在网站上: http://leon.bottou.org/projects/infimnist
它说:
正在生成包含 MNIST8M 训练集的文件: $ infimnist 实验室 10000 8109999 > mnist8m-labels-idx1-ubyte $ infimnist pat 10000 8109999 > mnist8m-patterns-idx3-ubyte
但是,我不明白为什么它从 10 000 到 8 109 999 即使我这样做:8 109 999 - 10 000,它对我来说仍然没有意义。
对我来说 8M 将是 8 000 000 + 9 999,因为我将以 9 999 结束并从 10 000 开始到 8 009 999,这将是 800 万张图像。
有谁知道为什么计算为 8 109 999 吗?
根据一位 kaggle 用户的说法,这就是为什么:
8M数据集是原始图片+134distortions/original。所以有
135*60,000 = 8,100,000
训练图像。
将 10,000 张测试图像相加得到 8,110,000 张图像。
测试图像从索引 0 到 10,000-1=9,999,训练图像从索引 10,000 到 8,110,000-1 = 8,109,999。
希望对您有所帮助。
原始数据集也在这里:
https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html
您可以看到“# of data: 8,100,000”