Accueil l'audio Qu'est-ce que l'analyse Big Data open source? - définition de techopedia

Qu'est-ce que l'analyse Big Data open source? - définition de techopedia

Table des matières:

Anonim

Définition - Que veut dire Open-Source Big Data Analytics?

L'analyse de Big Data open source fait référence à l'utilisation de logiciels et d'outils open source pour analyser d'énormes quantités de données afin de collecter des informations pertinentes et exploitables qu'une organisation peut utiliser afin de poursuivre ses objectifs commerciaux. Le Hadoop d'Apache, le plus grand acteur de l'analyse open source des données volumineuses, est la bibliothèque de logiciels la plus largement utilisée pour traiter d'énormes ensembles de données sur un cluster d'ordinateurs à l'aide d'un processus distribué de parallélisme.

Techopedia explique l'analyse de Big Data Open-Source

L'analyse de données volumineuses open source utilise des logiciels et des outils open source afin d'exécuter des analyses de données volumineuses en utilisant soit une plateforme logicielle complète, soit divers outils open source pour différentes tâches dans le processus d'analyse de données. Apache Hadoop est le système le plus connu pour l'analyse des mégadonnées, mais d'autres composants sont nécessaires avant qu'un véritable système d'analyse puisse être mis en place.

Hadoop est l'implémentation open source de l'algorithme MapReduce mis au point par Google et Yahoo, c'est donc la base de la plupart des systèmes d'analyse aujourd'hui. De nombreux outils d'analyse du Big Data utilisent l'open source, y compris des systèmes de base de données robustes tels que MongoDB open source, une base de données NoSQL sophistiquée et évolutive très adaptée aux applications Big Data, ainsi qu'à d'autres.

Les services analytiques open source de Big Data comprennent:

  • Système de collecte de données
  • Centre de contrôle pour l'administration et la surveillance des clusters
  • Bibliothèque d'apprentissage automatique et d'exploration de données
  • Service de coordination des applications
  • Moteur de calcul
  • Cadre d'exécution
Qu'est-ce que l'analyse Big Data open source? - définition de techopedia