Spark et SQL-On-Hadoop : vers un Hadoop augmenté

Spark et SQL-On-Hadoop : vers un Hadoop augmenté

Cover

La sphère Hadoop n’a plus rien à voir avec celle de 2011. Le framework et son système de fichier HDFS sont devenus un noyau autour duquel gravitent de nombreux projets pour l’adapter à des situations pour lesquelles ils n’avaient pas été conçus : temps réel, Machine Learning et requêtes SQL.

C’est dans ce contexte que s’inscrivent Spark, Impala, Kudu, Storm, Kafka, Pig, Hive et Arrow – le petit dernier – tous développés pour augmenter Hadoop et en faire un outil qui correspond davantage aux entreprises. Un cheminement vers une démocratisation d’Hadoop, en quelque sorte, à base de temps réel et de SQL.

Sponsor :
LeMagIT
Posté le :
8 févr. 2021
Document paru le :
16 mars 2016
Format :
PDF
Type :
eBook
Déjà membre de Bitpipe.fr ? Connexion

Télécharger cet eBook !