Table des matières:
Définition - Que signifie Data Cube?
Un cube de données fait référence à une plage de valeurs tridimensionnelle (3D) (ou supérieure) qui est généralement utilisée pour expliquer la séquence temporelle des données d'une image. Il s'agit d'une abstraction de données pour évaluer des données agrégées à partir de divers points de vue. Il est également utile pour l'imagerie de spectroscopie car une image résolue spectralement est représentée comme un volume 3D.
Un cube de données peut également être décrit comme les extensions multidimensionnelles des tables bidimensionnelles. Il peut être considéré comme une collection de tables 2D identiques empilées les unes sur les autres. Les cubes de données sont utilisés pour représenter des données trop complexes pour être décrites par un tableau de colonnes et de lignes. En tant que tels, les cubes de données peuvent aller bien au-delà de la 3D pour inclure de nombreuses autres dimensions.
Techopedia explique Data Cube
Un cube de données est généralement utilisé pour interpréter facilement les données. Il est particulièrement utile lors de la représentation de données avec des dimensions comme certaines mesures des besoins de l'entreprise. Chaque dimension d'un cube représente certaines caractéristiques de la base de données, par exemple, les ventes quotidiennes, mensuelles ou annuelles. Les données incluses dans un cube de données permettent d'analyser presque tous les chiffres pour pratiquement tous les clients, les agents de vente, les produits et bien plus encore. Ainsi, un cube de données peut aider à établir des tendances et à analyser les performances.
Les cubes de données sont principalement classés en deux catégories:
- Cube de données multidimensionnel: la plupart des produits OLAP sont développés sur la base d'une structure dans laquelle le cube est structuré comme un tableau multidimensionnel. Ces produits OLAP multidimensionnels (MOLAP) offrent généralement des performances améliorées par rapport à d'autres approches, principalement parce qu'ils peuvent être indexés directement dans la structure du cube de données pour rassembler des sous-ensembles de données. Lorsque le nombre de dimensions est supérieur, le cube devient plus clairsemé. Cela signifie que plusieurs cellules qui représentent des combinaisons d'attributs particulières ne contiendront aucune donnée agrégée. Cela augmente à son tour les exigences de stockage, qui peuvent parfois atteindre des niveaux indésirables, ce qui rend la solution MOLAP intenable pour d'énormes ensembles de données de nombreuses dimensions. Les techniques de compression pourraient aider; cependant, leur utilisation peut endommager l'indexation naturelle de MOLAP.
- OLAP relationnel: OLAP relationnel utilise le modèle de base de données relationnelle. Le cube de données ROLAP est utilisé comme un ensemble de tables relationnelles (environ deux fois plus que la quantité de dimensions) par rapport à un tableau multidimensionnel. Chacun de ces tableaux, appelé cuboïde, signifie une vue spécifique.