Accueil l'audio Qu'est-ce que l'écosystème hadoop? - définition de techopedia

Qu'est-ce que l'écosystème hadoop? - définition de techopedia

Table des matières:

Anonim

Définition - Que signifie l'écosystème Hadoop?

L'écosystème Hadoop fait référence aux différents composants de la bibliothèque de logiciels Apache Hadoop, ainsi qu'aux accessoires et outils fournis par la Fondation Apache pour ces types de projets logiciels, et à la manière dont ils fonctionnent ensemble.

Hadoop est un framework basé sur Java qui est extrêmement populaire pour la gestion et l'analyse de grands ensembles de données.

Techopedia explique l'écosystème Hadoop

Le package de base Hadoop et ses accessoires sont pour la plupart des projets open source sous licence Apache. L'idée d'un écosystème Hadoop implique l'utilisation de différentes parties de l'ensemble Hadoop de base comme MapReduce, un cadre pour gérer de grandes quantités de données, et le Hadoop Distributed File System (HDFS), un système sophistiqué de gestion de fichiers. Il y a aussi YARN, un gestionnaire de ressources Hadoop.

En plus de ces éléments clés de Hadoop, Apache a également fourni d'autres types d'accessoires ou d'outils complémentaires pour les développeurs. Il s'agit notamment d'Apache Hive, un outil d'analyse de données; Apache Spark, un moteur général pour le traitement des mégadonnées; Apache Pig, un langage de flux de données; HBase, un outil de base de données; et aussi Ambarl, qui peut être considéré comme un gestionnaire d'écosystème Hadoop, car il aide à gérer ensemble l'utilisation de ces différentes ressources Apache. Avec Hadoop devenant la norme de facto pour la collecte de données et devenant omniprésent dans de nombreuses organisations, les gestionnaires et les responsables du développement apprennent tout sur l'écosystème Hadoop et quels types de choses sont impliqués dans une configuration Hadoop générale.

Qu'est-ce que l'écosystème hadoop? - définition de techopedia