Reprise après sinistre (DR)
La fonction de reprise après sinistre (DR) vous permet de récupérer des machines virtuelles et des vApps à partir d’une panne matérielle catastrophique qui désactive ou détruit un pool ou un site entier.
Pour vous protéger contre les défaillances d’un seul serveur, vous pouvez utiliser la haute disponibilité. La haute disponibilité redémarre les machines virtuelles sur un autre serveur du même pool.
Comprendre la DR
La reprise après sinistre stocke toutes les informations nécessaires à la restauration de vos machines virtuelles et vApps critiques sur des référentiels de stockage (SR). Ces référentiels de stockage sont ensuite répliqués de votre environnement principal (de production) vers un environnement de sauvegarde. Lorsqu’un pool protégé de votre site principal tombe en panne, les machines virtuelles et les vApps de ce pool peuvent être récupérés à partir du stockage répliqué et recréés sur un site secondaire (DR). Le résultat est un temps d’arrêt minimal des applications ou des utilisateurs.
Une fois que les machines virtuelles récupérées sont opérationnelles dans le pool de reprise après sinistre, les métadonnées du pool de reprise après sinistre doivent également être enregistrées sur le stockage répliqué. Cette action permet de restaurer les machines virtuelles et les vApps récupérées sur le site principal lorsqu’il est de nouveau en ligne.
Remarque :
La reprise après sinistre ne peut être utilisée qu’avec les types de stockage LVM sur HBA ou LVM sur iSCSI.
Les machines virtuelles XenServer se composent de deux composants :
- Disques virtuels utilisés par la machine virtuelle, stockés sur des référentiels de stockage (SR) configurés dans le pool où se trouvent les machines virtuelles.
- Métadonnées décrivant l’environnement des machines virtuelles. Les métadonnées contiennent toutes les informations nécessaires pour recréer la machine virtuelle si la machine virtuelle d’origine n’est pas disponible ou endommagée. La plupart des métadonnées sont écrites lors de la création de la machine virtuelle et ne sont mises à jour que lorsque vous modifiez la configuration de la machine virtuelle. Pour les machines virtuelles d’un pool, une copie de ces métadonnées est stockée sur chaque serveur du pool.
Dans un environnement de reprise après sinistre, les machines virtuelles sont recréées sur un site secondaire (DR) à partir des métadonnées du pool, c’est-à-dire des informations de configuration concernant toutes les machines virtuelles et les vApp du pool. Les métadonnées de chaque machine virtuelle incluent son nom, sa description et son identifiant unique universel (UUID), ainsi que sa mémoire, son processeur virtuel, sa mise en réseau et sa configuration de stockage. Il inclut également les options de démarrage de la machine virtuelle utilisées lors du redémarrage de la machine virtuelle dans un environnement haute disponibilité ou DR : ordre de démarrage, intervalle de retard et priorité de redémarrage. Par exemple, lors de la restauration de machines virtuelles, les machines virtuelles d’un vApp redémarrent dans le pool de reprise après sinistre dans l’ordre et avec les intervalles de retard spécifiés dans les métadonnées.
Remarque :
Pour utiliser la reprise après sinistre, vous devez être connecté en tant que root ou avoir un rôle d’opérateur de pool ou supérieur.
Terminologie de la reprise
vApp : groupe logique de machines virtuelles associées gérées en tant qu’entité unique.
Site : groupe physique de pools de ressources, de stockage et d’équipements matériels XenServer.
Site principal : sitephysique qui exécute des machines virtuelles ou des vApps qui doivent être protégées en cas de sinistre.
Site secondaire, site de reprise après sinistre : site physique dont le but est de servir d’emplacement de récupération pour le site principal, en cas de sinistre.
Basculement : récupération des machines virtuelles et des vApps sur un site secondaire (récupération) en cas de sinistre sur le site principal.
Restaurationautomatique : restaurationdes machines virtuelles et des vApps sur le site principal à partir d’un site secondaire (de récupération).
Test de basculement : un basculement « à sec » dans le cadre duquel les machines virtuelles et les vApps sont restaurées à partir d’un stockage répliqué vers un pool situé sur un site secondaire (de restauration) mais ne sont pas démarrés. Des basculements de test peuvent être exécutés pour vérifier que la reprise après sinistre est correctement configurée et que vos processus sont efficaces.
Métadonnées du pool : informations sur les machines virtuelles et les vApps du pool, telles que leur nom et leur description. Pour les machines virtuelles, les informations de configuration incluent l’UUID, la mémoire, le processeur virtuel, la configuration du réseau et du stockage, ainsi que les options de démarrage. Les métadonnées du pool sont utilisées dans la reprise après sinistre pour recréer les machines virtuelles et les vApp à partir du site principal dans un pool de récupération sur le site secondaire.
Infrastructure de reprise après sinistre
Pour utiliser la reprise après sinistre, configurez l’infrastructure de reprise après sinistre appropriée sur les sites principal et secondaire :
- Le stockage utilisé à la fois pour les métadonnées du pool et les disques virtuels utilisés par les machines virtuelles doit être répliqué de votre environnement principal (de production) vers un environnement de sauvegarde. La réplication du stockage, par exemple en utilisant la mise en miroir, varie d’un appareil à l’autre. Nous vous recommandons d’utiliser votre solution de stockage pour gérer la réplication du stockage.
- Une fois que les machines virtuelles et les vApp récupérées sont opérationnelles sur un pool de votre site de reprise après sinistre, répliquez les SR contenant les métadonnées du pool de reprise après sinistre et les disques virtuels. Cette action permet aux machines virtuelles et aux vApps récupérées d’être restaurées sur le site principal (retour arrière) une fois que le site principal est de nouveau en ligne.
- L’infrastructure matérielle de votre site de reprise après sinistre ne doit pas nécessairement correspondre à celle du site principal. Cependant, l’environnement XenServer doit être au même niveau de version et de correctif. En outre, des ressources suffisantes doivent être configurées dans le pool cible pour permettre à toutes les machines virtuelles ayant basculé d’être recréées et démarrées.
Important :
XenCenter et l’assistant de reprise après sinistre ne contrôlent aucune fonctionnalité des baies de stockage. Assurez-vous que les métadonnées du pool et le stockage utilisé par les machines virtuelles qui doivent être redémarrées en cas de sinistre sont répliqués sur un site de sauvegarde. Certaines baies de stockage comportent des fonctions de mise en miroir qui permettent d’effectuer la copie automatiquement. Si ces fonctionnalités sont utilisées, désactivez la fonctionnalité de mise en miroir avant le redémarrage des machines virtuelles sur le site de récupération.
Basculement, restauration automatique et basculement de test avec l’assistant de reprise après sinistre
L’assistant de reprise après sinistre simplifie le basculement et le retour arrière. Les étapes impliquées dans ces processus sont décrites ici :
Basculement
-
Choisissez un pool cible sur votre site de reprise après sinistre secondaire sur lequel vous souhaitez récupérer vos machines virtuelles et vApp.
-
Fournissez des détails sur les cibles de stockage contenant les SR répliqués à partir de votre site principal. L’assistant analyse les cibles et répertorie tous les SR qui s’y trouvent.
-
Sélectionnez les SR contenant les métadonnées et les disques virtuels pour les machines virtuelles et les vApp que vous souhaitez récupérer. L’Assistant analyse les SR et répertorie toutes les machines virtuelles et les vApps trouvées.
-
Sélectionnez les machines virtuelles et les vApps que vous souhaitez restaurer sur le site de reprise après sinistre. Indiquez si vous souhaitez que l’Assistant les démarre automatiquement lorsqu’ils ont été récupérés ou si vous préférez attendre et les démarrer manuellement vous-même.
L’assistant effectue des vérifications préalables pour s’assurer que les machines virtuelles et les vApp sélectionnées peuvent être restaurées dans le pool de DR cible. Par exemple, l’Assistant vérifie que tout le stockage requis par les machines virtuelles et les vApps sélectionnés est disponible.
Lorsque les prévérifications sont terminées et que tous les problèmes sont résolus, le processus de basculement commence. Les machines virtuelles et les vApp sélectionnées sont exportées du stockage répliqué vers le pool de reprise après sinistre. Le basculement est maintenant terminé.
Restauration automatique
-
Choisissez le pool cible de votre site principal sur lequel vous souhaitez restaurer les machines virtuelles et les vApps en cours d’exécution sur le site de reprise après sinistre.
-
Fournissez des détails sur les cibles de stockage contenant les SR répliqués à partir de votre site de reprise après sinistre. L’assistant analyse les cibles et répertorie tous les SR trouvés.
-
Sélectionnez les SR contenant les métadonnées et les disques virtuels pour les machines virtuelles et les vApp que vous souhaitez restaurer. L’Assistant analyse les SR et répertorie toutes les machines virtuelles et les vApps trouvées.
-
Sélectionnez les machines virtuelles et les vApps que vous souhaitez restaurer sur le site principal. Indiquez si vous souhaitez que l’Assistant les démarre automatiquement lorsqu’ils ont été récupérés ou si vous préférez attendre et les démarrer manuellement vous-même.
L’assistant effectue ensuite des vérifications préalables pour s’assurer que les machines virtuelles et les vApp sélectionnées peuvent être restaurées dans le pool cible sur le site principal. Par exemple, l’Assistant vérifie que tout le stockage requis par les machines virtuelles et les vApps sélectionnés est disponible.
Lorsque les prévérifications sont terminées et que tous les problèmes sont résolus, le processus de restauration automatique commence. Les machines virtuelles et les vApps sélectionnées exécutées sur votre site de reprise après sinistre sont exportées du stockage répliqué vers le pool sélectionné sur votre site principal.
Le retour arrière est maintenant terminé.
Si l’assistant de reprise après sinistre trouve des informations relatives à la même machine virtuelle à deux ou plusieurs emplacements, il utilise uniquement les informations les plus récentes par machine virtuelle. Par exemple, les informations peuvent être stockées sur le stockage du site principal, le stockage du site de reprise après sinistre et dans le pool dans lequel les données sont importées.
Conseil :
Pour faciliter la récupération des machines virtuelles et des vApps, nommez vos SR pour indiquer comment vos VM et vApp sont mappés aux SR, et les SR aux LUN.
Vous pouvez également utiliser l’assistant de reprise après sinistre pour exécuter des basculements de test afin de tester sans interruption de service votre système de reprise après sinistre. Dans un test de basculement, les étapes sont les mêmes que pour le basculement, mais les machines virtuelles et les vApp récupérées sont démarrées en pause sur le site de reprise après sinistre. Le nettoyage est effectué lorsque le test est terminé pour supprimer toutes les machines virtuelles, les vApps et le stockage recréé sur le site de reprise après sinistre. Pour plus d’informations, reportez-vous à la section Test de basculement.