Table des matières:
Définition - Que signifie Data Lake?
Un lac de données est un référentiel massif, facilement accessible et centralisé de grands volumes de données structurées et non structurées.Techopedia explique Data Lake
L'architecture du lac de données est une approche de tout stocker pour les mégadonnées. Les données ne sont pas classées lorsqu'elles sont stockées dans le référentiel, car la valeur des données n'est pas claire au départ. En conséquence, la préparation des données est éliminée. Un lac de données est donc moins structuré par rapport à un entrepôt de données conventionnel. Lorsque les données sont accessibles, ce n'est qu'à ce moment-là qu'elles sont classées, organisées ou analysées.
Hadoop, un framework open source pour le traitement et l'analyse des mégadonnées, peut être utilisé pour parcourir les données du référentiel.
