Table des matières:
Définition - Que signifie la caractérisation?
La caractérisation est une méthodologie de Big Data utilisée pour générer des paramètres descriptifs qui décrivent efficacement les caractéristiques et le comportement d'un élément de données particulier. Ceci est ensuite utilisé dans des algorithmes d'apprentissage non supervisés afin de trouver des modèles, des grappes et des tendances sans incorporer des étiquettes de classe qui peuvent avoir des biais. Il a ses utilisations dans l'analyse des clusters et même dans le deep learning.
Techopedia explique la caractérisation
La caractérisation des mégadonnées est une technique pour transformer des données brutes en informations utiles, utilisée dans les algorithmes d'apprentissage automatique et l'exploration de données. La caractérisation génère essentiellement des représentations condensées de tout contenu d'information caché dans les données. Par conséquent, il peut être utilisé comme un moyen de mesurer et de suivre les événements, les changements et les nouveaux comportements émergents dans de grands flux de données dynamiques.
Quelques avantages de la caractérisation:
- Peut générer des mesures utiles pour suivre et mesurer les événements et les anomalies dans les ensembles de données
- Crée des représentations à petite empreinte des informations essentielles
- Accomplit rapidement la conversion des données en informations, ce qui rapproche l'industrie de la transformation complète des données en informations en connaissances
- Est utile pour indexer et baliser des objets, événements et autres fonctionnalités spécifiques dans une collection de données


