Accueil Bases de données Pourquoi les gestionnaires devraient-ils se prémunir contre la redondance des bases de données?

Pourquoi les gestionnaires devraient-ils se prémunir contre la redondance des bases de données?

Anonim

Q:

Pourquoi les gestionnaires devraient-ils se prémunir contre la redondance des bases de données?

UNE:

Les gestionnaires de bases de données et autres professionnels de l'informatique doivent se prémunir contre la «redondance des bases de données» ou la «redondance des données» en raison de tous les impacts négatifs que la redondance peut avoir dans un système ou un environnement de base de données. Partout où une certaine donnée est dupliquée, soit dans deux champs d'une base de données, soit dans deux environnements de base de données différents, cela peut avoir des conséquences sur la récupération des données.

L'une des premières raisons pour éviter la redondance des données est qu'elle peut être inutile ou excessive.

Il est important de souligner que certains types de redondance des données sont prévus, afin de sauvegarder et sauvegarder les données. Cependant, d'autres résultent d'un codage médiocre ou inefficace, ou du manque d'attention aux meilleures pratiques. Dans de nombreux cas, de grandes quantités de redondance de données entraînent une croissance rapide de la base de données au-delà d'une taille raisonnable. Dans cet esprit, de nombreux efforts pour lutter contre la redondance des données sont faits pour économiser de l'espace dans une base de données et, par conséquent, pour réduire les coûts et les efforts de maintenance. Cependant, cela doit être fait dans un souci de praticité - les ingénieurs peuvent pratiquer ce qu'on appelle la déduplication des données, mais cela doit être fait de manière efficace.

Par exemple, les gestionnaires de bases de données peuvent explorer quelque chose comme retirer une chaîne d'un champ répété, comme un nom de client ou d'entreprise partagé, et le remplacer par une simple référence de variable où la chaîne est conservée ailleurs. Cela peut économiser de l'espace sur une base de données - mais cela peut également nécessiter plus d'activité du serveur pour effectuer une requête donnée, de sorte qu'il peut ne pas être aussi efficace qu'il n'y paraît.

Une autre raison importante de dédupliquer les données ou d'éviter la redondance des données est la confusion qui peut en résulter. Les données redondantes dans une base de données peuvent provoquer différents types d'anomalies. L'une d'entre elles est appelée anomalie de mise à jour - des anomalies de mise à jour se produisent lorsqu'un enregistrement est à nouveau entré avec des informations mises à jour, mais la mise à jour ne revient pas à l'enregistrement d'origine. Dans une telle situation, il peut y avoir trois enregistrements différents pour un employé de l'entreprise particulier, avec trois titres d'emploi différents et trois adresses différentes, car les informations de la personne n'ont pas été mises à jour dans l'ensemble de la base de données, mais uniquement sur le dernier enregistrement entré.

Comme suggéré par les experts, les administrateurs de base de données peuvent éviter la redondance des données par conception. Ils peuvent également s'engager dans des pratiques de normalisation des données qui peuvent corriger les anomalies de mise à jour et d'autres types d'anomalies en normalisant la façon dont les enregistrements des tables de base de données sont conservés. Les administrateurs de base de données peuvent également poursuivre les efforts de déduplication des données qui nettoient et standardisent les données par d'autres moyens. Tout cela a pour objectif de créer des tables de base de données plus propres, de rendre les enregistrements de base de données plus cohérents et d'éviter tous les maux de tête et les problèmes complexes associés à la redondance des données non planifiée.

Pourquoi les gestionnaires devraient-ils se prémunir contre la redondance des bases de données?