Nota: (La base de datos de dígitos escritos a mano del Mnist, es un conjunto de Entrenamiento de 60.000 ejemplos y un conjunto de Prueba de 10.000 ejemplos. Estos dígitos escritos a mano, se encuentra normalizado en el tamaño y una imagen de tamaño fijo).
Conjunto de Datos de clasificación de dígitos Mnist
-. Este es un conjunto de datos (Entrenamiento) de 60.000 imágenes en escala de grises de 28x28 de 10 dígitos, junto con un conjunto de prueba de 10.000 imágenes. Esta Base-Datos es ideal para quien desean probar técnicas de aprendizaje y métodos de reconocimiento de patrones en datos del Mundo-Real mientras dedican un esfuerzo mínimo al preprocesamiento y formateo.
Hay cuatro archivos disponibles en este sitio:
- train-images-idx3-ubyte.gz : imágenes del conjunto de entrenamiento (9912422 bytes)
- train-labels-idx1-ubyte.gz : etiquetas del conjunto de entrenamiento (28881 bytes)
- t10k-images-idx3-ubyte.gz : imágenes del conjunto de prueba (1648877 bytes )
- t10k-labels-idx1-ubyte.gz : etiquetas del conjunto de prueba (4542 bytes)
Pre-procesado-Mnist
-. Tenemos que tener en cuenta que Keras usa un Array-Multidimensional de NumPy como estructura de datos. Lo primero cargamos las librerías necesarias y carga el conjunto de datos Mnist con función load_data.
Cargamos Librerias:
- In: import numpy as np
- In: import tensorflow as tf
- In: from tensorflow import keras
- In: import matplotlib.pyplot as plt
Importamos Mnist:
- In: tf.keras.datasets.mnist.load_data(path=«mnist.npz»)
Nota: Tenemos que tener en cuenta que el conjunto de Datos-Mnist no sean bajado de la pagina oficial de Mnist , sino de el docs-Keras.
Tupla de Array-Multidimensional de NumPy : (x_train, y_train), (x_test, y_test).
- x_train : matriz uint8 NumPy de datos de imagen en escala de grises con formas (60000, 28, 28), que contiene los datos de entrenamiento. Los valores de píxeles oscilan entre 0 y 255.
- y_train : uint8 NumPy matriz de etiquetas de dígitos (enteros en el rango 0-9) con forma (60000,)para los datos de entrenamiento.
- x_test : matriz uint8 NumPy de datos de imagen en escala de grises con formas (10000, 28, 28), que contiene los datos de prueba. Los valores de píxeles oscilan entre 0 y 255.
- y_test : uint8 NumPy matriz de etiquetas de dígitos (enteros en el rango 0-9) con forma (10000,)para los datos de prueba.
Creamos array multidimensional de NumPy:
- (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
- assert x_train.shape == (60000, 28, 28)
- assert x_test.shape == (10000, 28, 28)
- assert y_train.shape == (60000,)
- assert y_test.shape == (10000,)
Visualizar lo cargado cambiar-Nº:
- In: plt.imshow(x_train[50],cmap=plt.cm.binary)
Recoplando:
Conjunto de Datos de clasificación de dígitos escritos a mano Mnist ideal para entrenar y evaluar nuestros modelos en este caso de Keras.
- Referencias: (Entorno-Moreluz)
- Referencias: (Docs-Keras)