91精品国产综合久久消防器材,色先锋色资源看片资源网,国产美女亚洲精品久久久毛片

訓練集與測試集

CIFAR-10數據集被劃分為5個訓練batch和1個測試batch，每個batch包含10000張圖片。測試集的圖片是從每個類別中隨機挑選的1000張圖片組成的，而訓練集的圖片則是以隨機順序包含剩下的50000張圖片。需要注意的是，一些訓練集batch可能會出現包含某一類圖片比其他類的圖片數量多的情況。

數據集特點

CIFAR-10數據集的特點是圖像尺寸較小，但類別豐富，且每個類別的樣本數量均衡。這使得CIFAR-10成為一個理想的圖像識別基準數據集，尤其是在評估卷積神經網絡等深度學習模型時。

CIFAR-10數據集下載與解壓

官方提供了多個版本的CIFAR-10數據集，包括Python版本、Matlab版本和二進制版本。這里我們下載Python版本。下載完成后，解壓得到包含以下文件的文件夾：

CIFAR-10文件結構

文件結構說明

batches.meta：程序中不需要使用的文件。
data_batch_1：訓練集的第一個batch，含有10000張圖片。
data_batch_2：訓練集的第二個batch，含有10000張圖片。
data_batch_3：訓練集的第三個batch，含有10000張圖片。
data_batch_4：訓練集的第四個batch，含有10000張圖片。
data_batch_5：訓練集的第五個batch，含有10000張圖片。
readme.html：網頁文件，程序中不需要使用的文件。
test_batch：測試集的batch，含有10000張圖片。

CIFAR-10數據集解析

每個batch文件包含一個Python字典結構，包含以下元素：

b’data’：一個10000×3072的array，每一行的元素組成了一個32×32的3通道圖片，共10000張。
b’labels’：一個長度為10000的list，對應包含data中每一張圖片的label。
b’batch_label’：這一份batch的名稱。
b’filenames’：一個長度為10000的list，對應包含data中每一張圖片的名稱。

真正重要的兩個關鍵字是data和labels，剩下的兩個并不是十分重要。

獲取每個batch文件中的字典信息

import numpy as np
import pickle

def unpickle(file):
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

提取每張圖片的RGB通道數據

import numpy as np

def GetPhoto(pixel):
    assert len(pixel) == 3072
    r = pixel[0:1024]; r = np.reshape(r, [32, 32, 1])
    g = pixel[1024:2048]; g = np.reshape(g, [32, 32, 1])
    b = pixel[2048:3072]; b = np.reshape(b, [32, 32, 1])

    photo = np.concatenate([r, g, b], -1)

    return photo

提取訓練集batch中的數據


import numpy as np

def GetTrainDataByLabel(label):
    batch_label = []
    labels = []
    data = []
    filenames = []
    for i in range(1, 1+5):
        batch_label.append(unpickle(