Nota: Los Dataset en Machine-Learning & Deep-Learning son conjuntos de datos históricos que sirven de base para entrenar un algoritmo con el objetivo de que una máquina pueda tomar decisiones. Estas decisiones serán tomadas justamente de los datos provistos por el Dataset.
Cargar-Datos-Dataset
-. API-Keras pose una serie de utilidades de carga de datos “Dataset”. Estas están localizadas en tf.keras.utils, nos facilitara a introducir los lo datos “Dataset”sin procesar en el disco a un objeto tf.keras.datasets que se puede usar para entrenar un Modelo-Keras de manera eficiente. Estas utilidades de Cargar-Datos-Dataset se pueden combinar con Layers de preprocesamiento para transformar aún más su conjunto de Datos de entrada antes del entrenamiento.
-. Pongamos un ejemplo usaremos el conjunto Dataset MNIST.
Cargamos las Librerías:
- In: import numpy as np
- In: import tensorflow as tf
- In: from tensorflow import keras
Cargar el conjunto dataset MNIST:
- In: mnist = tf.keras.datasets.mnist
Convertir los valores a coma flotante y normalizados.
- In: (x_train, y_train), (x_test, y_test) = mnist.load_data()
- In: x_train, x_test = x_train / 255.0, x_test / 255.0
. Con esto ateriríamos los Datos listos para el Modelo–Keras.
Relación de Cargar-Datos-Dataset disponibles:
- Carga de datos de imagen
- Carga de datos de series temporales
- Carga de datos de texto
- Carga de datos de audio
Conjunto de datos de clasificación de dígitos MNIST
Función .load_data carga el conjunto de datos MNIST:
- In: tf.keras.datasets.mnist.load_data(path=«mnist.npz»)
. Este es un conjunto de datos de 60.000 imágenes en escala de grises de 28×28 de 10 dígitos, junto con un conjunto de prueba de 10.000 imágenes. Se puede encontrar más información en la página de inicio del MNIST .
Tupla de arreglos NumPy : (x_train, y_train), (x_test, y_test):
- x_train : matriz uint8 NumPy de datos de imagen en escala de grises con formas (60000, 28, 28), que contiene los datos de entrenamiento. Los valores de píxeles oscilan entre 0 y 255. en este caso 28, 28
- y_train : uint8 NumPy matriz de etiquetas de dígitos con forma (60000,)para los datos de entrenamiento.
- x_test : matriz uint8 NumPy de datos de imagen en escala de grises con formas (10000, 28, 28), que contiene los datos de prueba. Los valores de píxeles oscilan entre 0 y 255. en este caso 28, 28
- y_test : uint8 NumPy matriz de etiquetas de dígitos con forma (10000,)para los datos de prueba
Pongamos un ejemplo de esto:
- (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
- assert x_train.shape == (60000, 28, 28)
- assert x_test.shape == (10000, 28, 28)
- assert y_train.shape == (60000,)
- assert y_test.shape == (10000,)
Recopilando:
Cargamos los Datos y un vistazo al Dataset-MNIST
- Referencias: (Entorno-Moreluz)
- Referencias: (Keras)