Recuperación ante desastres (DR)
La función de recuperación ante desastres (RAD) le permite recuperar VM y vApp de una falla catastrófica del hardware que inhabilita o destruye todo un grupo o sitio.
Para la protección contra fallos de un solo servidor, puede usar Alta disponibilidad. La alta disponibilidad reinicia las máquinas virtuales en un servidor alternativo en el mismo grupo.
Comprender la DR
La recuperación ante desastres almacena toda la información necesaria para recuperar sus VM y vApps críticos para el negocio en repositorios de almacenamiento (SR). A continuación, estos repositorios de almacenamiento de información se replican desde su entorno principal (de producción) a un entorno de backup. Cuando se produce un error en un grupo protegido de su sitio principal, las máquinas virtuales y las vApps de ese grupo se pueden recuperar del almacenamiento replicado y volver a crearlas en un sitio secundario (DR). El resultado es un tiempo de inactividad mínimo de aplicaciones o usuarios.
Una vez que las máquinas virtuales recuperadas estén en funcionamiento en el grupo de DR, los metadatos del grupo de DR también se deben guardar en el almacenamiento que se replica. Esta acción permite que las máquinas virtuales y vApps recuperadas se vuelvan a restaurar en el sitio principal cuando vuelvan a estar en línea.
Nota:
La recuperación ante desastres solo se puede usar con los tipos de almacenamiento LVM sobre HBA o LVM sobre iSCSI.
Las máquinas virtuales de XenServer constan de dos componentes:
- Discos vDisk que utiliza la máquina virtual, almacenados en repositorios de almacenamiento (SR) configurados en el grupo donde se encuentran las máquinas virtuales.
- Metadatos que describen el entorno VM. Los metadatos contienen toda la información necesaria para volver a crear la VM si la VM original no está disponible o está dañada. La mayoría de los metadatos se escriben cuando se crea la VM y se actualizan solo cuando se cambia la configuración de la VM. Para las máquinas virtuales de un grupo, se almacena una copia de estos metadatos en cada servidor del grupo.
En un entorno de DR, las máquinas virtuales se recrean en un sitio secundario (DR) a partir de los metadatos del grupo: información de configuración sobre todas las máquinas virtuales y vApps del grupo. Los metadatos de cada VM incluyen su nombre, descripción e identificador único universal (UUID), y su memoria, CPU virtual, redes y configuración de almacenamiento. También incluye las opciones de inicio de VM que se utilizan al reiniciar la VM en un entorno de alta disponibilidad o DR: orden de inicio, intervalo de demora y prioridad de reinicio. Por ejemplo, al recuperar máquinas virtuales, las máquinas virtuales de una vApp se reinician en el grupo de DR en el orden y con los intervalos de demora especificados en los metadatos.
Nota:
Para usar la recuperación ante desastres, debe iniciar sesión como root o tener un rol de operador de grupo o superior.
Terminología sobre la recuperación
vApp: grupo lógico de máquinas virtuales relacionadas que se administran como una sola entidad.
Sitio: grupo físico de grupos de recursos, almacenamiento y equipos de hardware de XenServer.
Sitio principal: sitio físico que ejecuta máquinas virtuales o vApps que deben protegerse en caso de desastre.
Sitio secundario, sitio de recuperación antedesastres: sitio físico cuyo propósito es servir como ubicación de recuperación para el sitio principal, en caso de desastre.
Conmutación por error: recuperación de máquinas virtuales y vApps en un sitio secundario (recuperación) en caso de desastre en el sitio principal.
Conmutación por recuperación: restauración de máquinas virtuales y vApps de vuelta al sitio principal desde un sitio secundario (recuperación).
Conmutación por error de prueba: una conmutación por error de “ejecución en seco” en la que las máquinas virtuales y las vApps se recuperan del almacenamiento replicado en un grupo en un sitio secundario (recuperación), pero no se inician. Se pueden ejecutar conmutaciones por error de prueba para comprobar que la DR está configurada correctamente y que los procesos son efectivos.
Metadatos del grupo: información sobre las máquinas virtuales y las vApps del grupo, como su nombre y descripción. Para las máquinas virtuales, la información de configuración incluye UUID, memoria, CPU virtual, configuración de redes y almacenamiento y opciones de inicio. Los metadatos del grupo se utilizan en DR para volver a crear las máquinas virtuales y las vApps desde el sitio principal en un grupo de recuperación en el sitio secundario.
Infraestructura de recuperación ante
Para utilizar la recuperación ante desastres, configure la infraestructura de DR adecuada tanto en los sitios principales como en los secundarios:
- El almacenamiento utilizado tanto para los metadatos del grupo como para los discos virtuales utilizados por las VM se debe replicar desde su entorno principal (de producción) a un entorno de reserva. La replicación del almacenamiento, por ejemplo, mediante espejado, varía de un dispositivo a otro. Le recomendamos que utilice su solución de almacenamiento para gestionar la replicación del almacenamiento.
- Después de que las VM y vApps recuperadas estén en funcionamiento en un grupo de su sitio de recuperación ante desastres, replique los SR que contienen los metadatos del grupo de recuperación ante desastres y los discos virtuales. Esta acción permite que las máquinas virtuales y vApps recuperadas se restauren de nuevo en el sitio principal (conmutación por error) una vez que el sitio principal vuelva a estar en línea.
- La infraestructura de hardware de su sitio de DR no tiene que coincidir con el sitio principal. Sin embargo, el entorno XenServer debe tener el mismo nivel de versión y parche. Además, se deben configurar recursos suficientes en el grupo de destino para permitir que todas las máquinas virtuales de conmutación por error se vuelvan a crear e inicien.
Importante:
XenCenter y el asistente de recuperación ante desastres no controlan ninguna funcionalidad de los arreglos de almacenamiento. Asegúrese de que los metadatos del grupo y el almacenamiento utilizado por las máquinas virtuales que se van a reiniciar en caso de desastre se replican en un sitio de respaldo. Algunas cabinas de almacenamiento contienen funciones de espejado para lograr la copia automáticamente. Si se utilizan estas funciones, inhabilite la función de duplicación antes de que las máquinas virtuales se reinicien en el sitio de recuperación.
Conmutación por error, conmutación por recuperación y conmutación por error de prueba con el asistente de recuperación ante desastres
El asistente de recuperación ante desastres simplifica la conmutación por error y la conmutación por recuperación. Los pasos involucrados en estos procesos se describen aquí:
Conmutación por error
-
Elija un grupo de destino en el sitio de recuperación ante desastres secundario en el que quiera recuperar sus máquinas virtuales y vApps.
-
Proporcione detalles de los destinos de almacenamiento que contienen los SR replicados desde su sitio principal. El asistente analiza los destinos y enumera todos los SR encontrados allí.
-
Seleccione los SR que contienen los metadatos y los discos virtuales para las VM y vApps que quiere recuperar. El asistente analiza los SR y enumera todas las VM y vApps encontradas.
-
Seleccione qué máquinas virtuales y vApps quiere recuperar en el sitio de DR. Especifique si quiere que el asistente los inicie automáticamente cuando se hayan recuperado o si prefiere esperar e iniciarlos manualmente.
El asistente realiza comprobaciones previas para garantizar que las máquinas virtuales y vApps seleccionadas se puedan recuperar en el grupo de DR de destino. Por ejemplo, el asistente comprueba que todo el almacenamiento requerido por las VM y vApps seleccionados esté disponible.
Cuando se completan las comprobaciones previas y se resuelven los problemas, comienza el proceso de conmutación por error. Las máquinas virtuales y las vApps seleccionadas se exportan desde el almacenamiento replicado al grupo de DR. La conmutación por error ha finalizado.
Conmutación por recuperación
-
Elija el grupo de destino en el sitio principal en el que quiere restaurar las máquinas virtuales y las vApps que se ejecutan actualmente en el sitio de DR.
-
Proporcione detalles de los destinos de almacenamiento que contienen los SR replicados de su sitio de recuperación ante desastres. El asistente analiza los destinos y enumera todos los SR encontrados.
-
Seleccione los SR que contienen los metadatos y los discos virtuales para las VM y vApps que quiere restaurar. El asistente analiza los SR y enumera todas las VM y vApps encontradas.
-
Seleccione qué máquinas virtuales y vApps quiere restaurar en el sitio principal. Especifique si quiere que el asistente los inicie automáticamente cuando se hayan recuperado o si prefiere esperar e iniciarlos manualmente.
A continuación, el asistente realiza comprobaciones previas para garantizar que las máquinas virtuales y vApps seleccionadas se puedan recuperar en el grupo de destino del sitio principal. Por ejemplo, el asistente comprueba que todo el almacenamiento requerido por las VM y vApps seleccionados esté disponible.
Cuando se completan las comprobaciones previas y se resuelven los problemas, comienza el proceso de conmutación por recuperación. Las máquinas virtuales y las vApps seleccionadas que se ejecutan en el sitio de DR se exportan desde el almacenamiento replicado de vuelta al grupo seleccionado en el sitio principal.
La conmutación por recuperación ya está completa.
Si el asistente de recuperación ante desastres encuentra información para la misma máquina virtual en dos o más lugares, solo utiliza la información más reciente por máquina virtual. Por ejemplo, la información puede almacenarse en el almacenamiento del sitio principal, el almacenamiento del sitio de DR y en el grupo al que se importan los datos.
Sugerencia:
Para facilitar la recuperación de VM y vApp, asigne un nombre a sus SR para indicar cómo se asignan sus VM y vApps a SR y los SR a LUNs.
También puede usar el asistente de recuperación ante desastres para ejecutar conmutaciones por error de prueba para pruebas no disruptivas de su sistema de recuperación ante desastres. En una conmutación por error de prueba, los pasos son los mismos que para la conmutación por error, pero las máquinas virtuales y vApps recuperadas se inician en un estado de pausa en el sitio de recuperación ante desastres. La limpieza se realiza cuando finaliza la prueba para eliminar todas las máquinas virtuales, vApp y almacenamiento recreado en el sitio de recuperación ante desastres. Para obtener más información, consulte Probar conmutación por error.