Table des matières:
Définition - Que signifie Fault Tolerance?
La tolérance aux pannes est la manière dont un système d'exploitation (OS) répond à une défaillance matérielle ou logicielle. Le terme se réfère essentiellement à la capacité d'un système à permettre des pannes ou des dysfonctionnements, et cette capacité peut être fournie par un logiciel, du matériel ou une combinaison des deux. Pour gérer les défauts avec élégance, certains systèmes informatiques ont deux ou plusieurs systèmes en double.
Techopedia explique la tolérance aux pannes
Le logiciel de tolérance aux pannes peut faire partie de l'interface du système d'exploitation, permettant au programmeur de vérifier les données critiques à des points spécifiques au cours d'une transaction.
La tolérance aux pannes peut inclure:
- Répondre à une panne de courant (le plus bas niveau de tolérance aux pannes)
- Utilisation immédiate d'un système de sauvegarde en cas de panne du système
- Permettre aux disques en miroir de prendre immédiatement le relais pour un disque défaillant
- Plusieurs processeurs travaillent ensemble et comparent les données et les sorties pour les erreurs, puis corrigent immédiatement les erreurs détectées.
En général, une tolérance aux pannes de 100% ne peut jamais être atteinte en raison de contraintes de coût.
