Table des matières:
Définition - Que signifie le Data Wrangling?
La gestion des données est un type spécifique de gestion des données qui découle de nouvelles capacités logicielles introduisant des ensembles de données volumineux, désordonnés et divers qui doivent entrer dans une architecture orientée services (SOA) à des fins d'analyse et d'utilisation. La manipulation des données implique généralement de nombreuses techniques sophistiquées différentes pour traiter des données irrégulières ou diverses et les manipuler pour des cas d'utilisation commerciale.
Techopedia explique la lutte contre les données
Cela peut sembler un terme informel, mais la lutte des données occupe en fait un espace particulier dans la gestion des données. Un moyen utile de comprendre la gestion des données consiste à la comparer à la méthodologie d'extraction, de transformation et de chargement (ETL) souvent plus formelle. La manipulation des données a des aspects et des cas d'utilisation différents de ceux d'ETL. Il est souvent effectué par des spécialistes des données qualifiés ou d'autres personnes proches du pipeline. À certains égards, la manipulation des données pourrait être qualifiée de type d'ETL «open source» dans la mesure où les ingénieurs traitant les données peuvent être plus «pratiques» ou utiliser des méthodes d'extraction plus manuelles.
Pour ceux qui comprennent vraiment les processus raffinés par lesquels diverses données sont triées, triées et intégrées dans les architectures d'entreprise, la manipulation des données est en fait un sujet très important. Les professionnels de l'informatique examinent une vaste gamme d'outils, de ressources et de techniques pour apporter de la valeur à partir de données en désordre, brutes ou non structurées.
