Accueil Bases de données Qu'est-ce que la découverte de connaissances dans les bases de données (kdd)? - définition de techopedia

Qu'est-ce que la découverte de connaissances dans les bases de données (kdd)? - définition de techopedia

Table des matières:

Anonim

Définition - Que signifie la découverte des connaissances dans les bases de données (KDD)?

La découverte de connaissances dans les bases de données (KDD) est le processus de découverte de connaissances utiles à partir d'une collection de données. Cette technique d'exploration de données largement utilisée est un processus qui comprend la préparation et la sélection de données, le nettoyage des données, l'intégration de connaissances préalables sur les ensembles de données et l'interprétation de solutions précises à partir des résultats observés.

Les principaux domaines d'application de KDD comprennent le marketing, la détection des fraudes, les télécommunications et la fabrication.

Techopedia explique la découverte des connaissances dans les bases de données (KDD)

Traditionnellement, l'exploration de données et la découverte de connaissances étaient effectuées manuellement. Au fil du temps, la quantité de données dans de nombreux systèmes a dépassé la taille du téraoctet et ne pouvait plus être conservée manuellement. De plus, pour la réussite de toute entreprise, la découverte de modèles sous-jacents dans les données est considérée comme essentielle. En conséquence, plusieurs outils logiciels ont été développés pour découvrir des données cachées et faire des hypothèses, qui faisaient partie de l'intelligence artificielle.

Le processus KDD a atteint son apogée au cours des 10 dernières années. Il abrite désormais de nombreuses approches différentes de la découverte, qui comprennent l'apprentissage inductif, les statistiques bayésiennes, l'optimisation des requêtes sémantiques, l'acquisition de connaissances pour les systèmes experts et la théorie de l'information. Le but ultime est d'extraire des connaissances de haut niveau à partir de données de bas niveau.

KDD comprend des activités multidisciplinaires. Cela comprend le stockage et l'accès aux données, la mise à l'échelle des algorithmes vers des ensembles de données massifs et l'interprétation des résultats. Le processus de nettoyage et d'accès aux données inclus dans l'entreposage de données facilite le processus KDD. L'intelligence artificielle soutient également KDD en découvrant des lois empiriques à partir d'expérimentation et d'observations. Les schémas reconnus dans les données doivent être valides sur les nouvelles données et posséder un certain degré de certitude. Ces modèles sont considérés comme de nouvelles connaissances. Les étapes impliquées dans l'ensemble du processus KDD sont les suivantes:

  1. Identifiez l'objectif du processus KDD du point de vue du client.
  2. Comprendre les domaines d'application impliqués et les connaissances requises
  3. Sélectionnez un ensemble de données cible ou un sous-ensemble d'échantillons de données sur lesquels la découverte doit être effectuée.
  4. Nettoyez et prétraitez les données en décidant des stratégies pour gérer les champs manquants et modifier les données conformément aux exigences.
  5. Simplifiez les ensembles de données en supprimant les variables indésirables. Ensuite, analysez les fonctionnalités utiles qui peuvent être utilisées pour représenter les données, en fonction de l'objectif ou de la tâche.
  6. Associez les objectifs KDD aux méthodes d'exploration de données pour suggérer des modèles cachés.
  7. Choisissez des algorithmes d'exploration de données pour découvrir des modèles cachés. Ce processus consiste à décider quels modèles et paramètres pourraient être appropriés pour le processus KDD global.
  8. Recherchez des modèles d'intérêt sous une forme de représentation particulière, qui incluent des règles ou des arbres de classification, la régression et le regroupement.
  9. Interpréter les connaissances essentielles des modèles extraits.
  10. Utilisez les connaissances et intégrez-les dans un autre système pour de nouvelles actions.
  11. Documentez-le et rédigez des rapports pour les parties intéressées.
Qu'est-ce que la découverte de connaissances dans les bases de données (kdd)? - définition de techopedia