Mnist

Dataset

Nota: (La base de datos de dígitos escritos a mano del Mnist, es un conjunto de Entrenamiento de 60.000 ejemplos y un conjunto de Prueba de 10.000 ejemplos. Estos dígitos escritos a mano, se encuentra normalizado en el tamaño y una imagen de tamaño fijo).

 

Conjunto de Datos de clasificación de dígitos Mnist

-. Este es un conjunto de datos (Entrenamiento) de 60.000 imágenes en escala de grises de 28x28 de 10 dígitos, junto con un conjunto de prueba de 10.000 imágenes. Esta Base-Datos es ideal para quien desean probar técnicas de aprendizaje y métodos de reconocimiento de patrones en datos del Mundo-Real mientras dedican un esfuerzo mínimo al preprocesamiento y formateo.

Hay cuatro archivos disponibles en este sitio:

 

 

Pre-procesado-Mnist

-. Tenemos que tener en cuenta que Keras usa un Array-Multidimensional de NumPy como estructura de datos. Lo primero cargamos las librerías necesarias y carga el conjunto de datos Mnist con función load_data.

Cargamos Librerias:

  • In: import numpy as np
  • In: import tensorflow as tf
  • In: from tensorflow import keras
  • In: import matplotlib.pyplot as plt

Importamos Mnist:

  • In: tf.keras.datasets.mnist.load_data(path=«mnist.npz»)

Nota: Tenemos que tener en cuenta que el conjunto de Datos-Mnist no sean bajado de la pagina oficial de Mnist , sino de el docs-Keras.

Tupla de Array-Multidimensional de NumPy : (x_train, y_train), (x_test, y_test).

  • x_train : matriz uint8 NumPy de datos de imagen en escala de grises con formas (60000, 28, 28), que contiene los datos de entrenamiento. Los valores de píxeles oscilan entre 0 y 255.
  • y_train : uint8 NumPy matriz de etiquetas de dígitos (enteros en el rango 0-9) con forma (60000,)para los datos de entrenamiento.
  • x_test : matriz uint8 NumPy de datos de imagen en escala de grises con formas (10000, 28, 28), que contiene los datos de prueba. Los valores de píxeles oscilan entre 0 y 255.
  • y_test : uint8 NumPy matriz de etiquetas de dígitos (enteros en el rango 0-9) con forma (10000,)para los datos de prueba.

Creamos array multidimensional de NumPy:

  • (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
  • assert x_train.shape == (60000, 28, 28)
  • assert x_test.shape == (10000, 28, 28)
  • assert y_train.shape == (60000,)
  • assert y_test.shape == (10000,)

Visualizar lo cargado cambiar-Nº:

  • In: plt.imshow(x_train[50],cmap=plt.cm.binary)

 

Recoplando:

Conjunto de Datos de clasificación de dígitos escritos a mano Mnist ideal para entrenar y evaluar nuestros modelos en este caso de Keras.