Table des matières:
Malgré tous nos efforts pour les éviter, les incidents informatiques font inévitablement partie du travail - et essayer de garder une longueur d'avance sur les temps d'arrêt ayant un impact sur les entreprises devient de plus en plus difficile. Aujourd'hui, les systèmes sont étroitement couplés et de plus en plus complexes, et avec plus de pièces mobiles, il y a plus de possibilités pour que les choses tournent mal.
C'est une des raisons pour lesquelles de plus en plus d'organisations se tournent vers les microservices pour une disponibilité accrue des services et une meilleure résistance aux pannes. Mais même si ces conditions sont idéales pour rompre les applications monolithiques, elles peuvent également aggraver le risque de défaillance, sauf si elles sont conçues expressément en tenant compte de la résilience.
Se préparer à l'échec
Compte tenu de la nature intrinsèquement chaotique des systèmes distribués, les services devraient être développés non seulement pour anticiper la défaillance, mais pour récupérer automatiquement en cas de défaillance. Cela signifie déclencher des défaillances régulièrement pour garantir que vos systèmes peuvent gérer le chaos sans interrompre le service aux clients finaux. Et pour y parvenir, vous devez pouvoir simuler le trafic de production dans des environnements de test.