En el párrafo anterior hago referencia al software especializado, para mi es Apache-Spark es el líder del ecosistema (Big-Data): este es el enlace que nos lleva a este tema.

. Apache Spark es un marco (Framework) de computación en clúster de código abierto para procesamiento en tiempo real . Qué es Apache Spark Apache Spark : Es una poderosa ...
Leer Más
Leer Más

Descarga Spark:(descomprimir el fichero.tgz)-(crear)Mover a la carpeta /spark https://spark.apache.org/downloads.html In: root@juan-Aspire-ES1-512:/# curl -O https://archive.apache.org/dist/spark/spark-3.1.1/spark-3.1.1-bin-hadoop3.2.tgz In: root@juan-Aspire-ES1-512:/# tar xvf spark-3.1.1-bin-hadoop3.2.tgz In: root@juan-Aspire-ES1-512:/# mv spark-3.1.1-bin-hadoop3.2/ /spark Descarga de datos TXT y CSV ...
Leer Más
Leer Más