eviden-logo

Evidian > Produits > Logiciel de haute disponibilité - Zéro surcoût matériel > Différence entre haute disponibilité et tolérance aux fautes

Différence entre haute disponibilité et tolérance aux fautes

Evidian SafeKit

Comment comparer haute disponibilité et tolérance aux fautes ?

Aperçu

Cet article étudie les avantages et les inconvénients d'un cluster de haute disponibilité par rapport à un système tolérant aux fautes en examinant les contraintes matérielles, les défaillances logicielles, le RTO, le RPO...

Les tableaux comparatifs suivants expliquent en détail les différences entre un système tolérant aux fautes et SafeKit, un cluster logiciel de haute disponibilité.

Qu'est ce que la haute disponibilité ?

Un cluster de haute disponibilité repose sur deux serveurs avec redémarrage de l'application critique en cas de panne matérielle ou logicielle. Il existe 2 types de clusters : les clusters matériels et les clusters logiciels.

Les clusters matériels sont basés sur des disques partagés, ce qui entraîne des dépendances entre les serveurs et leurs connexions aux baies de disques partagés.

Les clusters logiciels, comme Evidian SafeKit, sont basés sur la réplication de données en temps réel et sont indépendants du matériel : ils peuvent être déployés sur des serveurs physiques ou virtuels ou dans le cloud.

Qu'est ce que la tolérance aux fautes ?

Un système tolérant aux fautes s'appuie sur du matériel spécialisé ou sur un hyperviseur spécialisé pour détecter une panne matérielle et basculer instantanément vers un composant matériel redondant sans redémarrage de l'application.

Les systèmes tolérants aux fautes ne traitent que les pannes matérielles et non les pannes logicielles, de loin la raison la plus courante d'indisponibilité d'un système.

Avantages et inconvénients de la haute disponibilité par rapport à la tolérance aux fautes

Cluster de haute disponibilité logicielle

Haute disponibilité active/active

Système fault-tolerant

Tolérance aux fautes

Produit

SafeKit sous Windows et Linux

Produits de tolérance aux fautes

Matériel, hyperviseur

Pas de matériel dédié, pas d'hyperviseur dédié.

Fonctionne avec l'hyperviseur standard et gratuit de Windows, Hyper-V, inclus dans le noyau Windows pour les serveurs et les PC.

Fonctionne avec l'hyperviseur standard et gratuit KVM (Kernel-based Virtual Machine) intégré dans le noyau Linux.

Chaque serveur peut-être le serveur de reprise de l'autre pour de multiples applications.

Matériel dédié ou hyperviseur dédié.

Le serveur secondaire est dédié à l'exécution de la même application synchronisée au niveau instruction.

Panne logicielle

Panne logicielle supportée avec redémarrage dans un environnement OS différent.

Exception logicielle sur les 2 serveurs en même temps sur le même OS.

Upgrade/fix en douceur de l'application ou de l'OS

Oui

Upgrade/fix en douceur de l'application ou de l'OS serveur par serveur.

Les versions N et N+1 peuvent coexister.

Non

Même application et OS sur les 2 serveurs.

RTO/RPO

Le temps de reprise avec SafeKit (RTO) dépend du temps de détection et de redémarrage de l'application (environ 1 minute).

La perte de données avec SafeKit (RPO) est nulle car la réplication est synchrone.

Le temps de reprise (RTO) d'un système fault-tolerant est nul.

L'application n'est pas redémarrée en cas de panne et continue son exécution sur le serveur secondaire.

La perte de données (RPO) est également nulle.

Flexibilité

Peut fonctionner sur n'importe quel type de serveur avec OS Windows et Linux standard

Dépend d'un matériel spécifique ou d'hyperviseurs spécifiques

Convient pour

Les éditeurs de logiciels qui souhaitent ajouter une option de disponibilité simple pour leur application

Environnement où les pannes matérielles sont la principale préoccupation

Différentiateurs de la solution de haute disponibilité SafeKit

SafeKit Quick Installation Guides

New application (real-time replication and failover)


New application (network load balancing and failover)


Database (real-time replication and failover)


Web (network load balancing and failover)


Full VM or container real-time replication and failover


Amazon AWS


Google GCP


Microsoft Azure


Other clouds


Physical security (real-time replication and failover)


Siemens (real-time replication and failover)