Que es Dataset

Dataset

Nota: (Los Datasets incluyen la tabla en la que se encuentran, incluyen también las relaciones entre tablas que contengan otros datos y no necesita hardware tan especializado como Big-Data. La diferencia del Big Data es hace referencia a grandes volúmenes de datos que los procesadores tradicionales no puedes procesar).

 

Que es Dataset-Dataframe

-. Dataset es una colección de Datos-tabulados, tenemos un conjunto de datos corresponde a una o más tablas de la Base-Datos, donde cada columna de una tabla representa una variable, y cada fila corresponde a un registro del conjunto de Datos que nos ocupa. El ConjuntoDatos enumera valores para cada una de las variables, como la altura y el peso de un objeto, para cada elemento del ConjuntoDatos. Los ConjuntosDatos también pueden consistir en una colección de documentos o archivos.

-. La principal característica de los Datasets es que ya tienen una estructura, es un modelo de programación relacional coherente e independientemente del origen de los Datos que contiene. Y en el otro extremo tenemos los RDD, conocidos como conjuntos de Datos-Desestructurados y definidos como una colección de elementos tolerante a fallos y son capaces de operar en paralelo.

-. El Dataframe tiene una estructura similar a la de una matriz. Pero en una matriz solamente se admiten valores numéricos esta es la diferencia fundamental, en un Dataframe se puede incluir también datos alfanuméricos en su contenido, el Dataframe puede contener distintos tipos de datos. En definitiva:Las matrices almacenan un único tipo de datos, pero en las matrices del Dataframe se aceptan valores alfanuméricos”.

 

Conjuntos-Datos-Disponibles

Conjunto de datos de clasificación de dígitos MNIST

Conjunto de datos de clasificación de imágenes pequeñas CIFAR10

Conjunto de datos de clasificación de imágenes pequeñas CIFAR100

Conjunto de datos de clasificación de sentimientos de reseñas de películas de IMDB

Conjunto de datos de clasificación de noticias de Reuters

Conjunto de datos MNIST de moda

Conjunto de datos de regresión de precios de la vivienda de Boston

 

Recopilando:

Con este conjuntos de Dataset que es tan a nuestra disposición de forma gratuita y sus enlaces directos al sitio, lo tomaremos como referencias para futuros post que necesitaremos Dataset para el proceso de Entrenamiento.