Table des matières:
- Définition - Que signifie la déduplication post-traitement (PPD)?
- Techopedia explique la déduplication post-traitement (PPD)
Définition - Que signifie la déduplication post-traitement (PPD)?
La déduplication post-processus (PPD) fait référence à un système dans lequel les processus logiciels filtrent les données redondantes d'un ensemble de données après leur transfert vers un emplacement de stockage de données. Cela peut également être appelé déduplication asynchrone et est souvent utilisé lorsque les gestionnaires considèrent qu'il est inefficace ou impossible de supprimer les données redondantes avant ou pendant le transfert.
Techopedia explique la déduplication post-traitement (PPD)
La déduplication post-processus peut être comparée à une pratique appelée déduplication en ligne où les données redondantes sont supprimées lors du transfert des données pour le stockage. L'une des raisons pour lesquelles les administrateurs peuvent choisir une approche de déduplication post-processus est que la déduplication en ligne peut ralentir le processus de transfert et rendre plus difficile l'archivage facile et efficace des données.
Bien que les gestionnaires ou les administrateurs puissent trouver plus facile d'utiliser une méthode de déduplication post-processus, ce type d'optimisation des données présente des inconvénients. L'une est le fait que la destination de stockage des données devra avoir suffisamment d'espace pour s'adapter à l'ensemble de données non filtré plus important. En supposant que les gestionnaires de données disposent d'un stockage suffisant et que l'analyse des données dans le stockage ne pose pas de difficultés techniques, la méthode de déduplication post-processus peut souvent être un moyen souhaitable de nettoyer un ensemble de données pour une utilisation future après qu'il a déjà été soigneusement caché dans "chambre froide."