Nota: En Big-Data “también llamados datos masivos, macrodatos, inteligencia de datos, datos a gran escala” Incluiré los Macrodatos “Big-Data” como tales. Apache-Spark como líder del ecosistema de Big-Data. Y por ultimo Dataset, que no son “Big” por lo cual ¡mas fácil de procesar!.
Los Macrodatos formado por conjuntos de datos de mayor tamaño y más complejos, especialmente procedentes de nuevas fuentes, estos volúmenes masivos de datos pueden utilizarse para abordar problemas que antes no hubiera sido posible solucionar. Imposible de abordar sin software especializado.
En el párrafo anterior hago referencia al software especializado, para mi es Apache-Spark es el líder del ecosistema (Big-Data): este es el enlace que nos lleva a este tema.
La diferencia del Big-Data, grandes volúmenes de datos, que los procesadores tradicionales no puedes procesar. Los Datasets, incluyen la tabla en la que se encuentran, relaciones entre tablas que contengan otros datos y necesitamos maquinas mas modestas.