XenServer

Hacer frente a los fallos de las

En esta sección se proporcionan detalles sobre cómo recuperarse de varios casos de error. Todos los casos de recuperación de errores requieren el uso de uno o más de los tipos de copia de seguridad enumerados en Copia de seguridad.

Fallas de miembros

En ausencia de HA, los nodos coordinadores del grupo detectan las fallas de los miembros al recibir mensajes de latidos regulares. Si no se ha recibido ningún latido durante 600 segundos, el coordinador del grupo asume que el miembro está muerto. Hay dos maneras de recuperarse de este problema:

  • Repare el host muerto (por ejemplo, reiniciándolo físicamente). Cuando se restablece la conexión con el miembro, el coordinador del grupo vuelve a marcar al miembro como vivo.

  • Apague el host e indique al coordinador del grupo que se olvide del nodo miembro mediante el comando de la interfaz de línea de comandos xe host-forget. Una vez que se olvida al miembro, todas las máquinas virtuales que se estaban ejecutando allí se marcan como desconectadas y se pueden reiniciar en otros hosts de XenServer.

    Es importante asegurarse de que el host de XenServer esté realmente desconectado; de lo contrario, podrían dañarse los datos de la máquina virtual.

    No divida su grupo en varios grupos de un solo host mediante el uso de xe host-forget. Esta acción puede provocar que todos asignen el mismo almacenamiento compartido y corrompan los datos de la VM.

Advertencia:

  • Si va a volver a utilizar el host olvidado como host activo, realice una nueva instalación del software XenServer.
  • No utilice el comando xe host-forget si HA está habilitada en el grupo. Inhabilite primero HA, luego olvide el host y, a continuación, vuelva a habilitar HA.

Cuando se produce un error en un host de XenServer miembro, es posible que aún haya máquinas virtuales registradas en estado de ejecución. Si está seguro de que el host de XenServer miembro está definitivamente inactivo, utilice el comando xe vm-reset-powerstate CLI para configurar el estado de alimentación de las máquinas virtuales. halted Consulte vm-reset-powerstate para obtener más información.

Advertencia:

El uso incorrecto de este comando puede provocar daños en los datos. Utilice este comando solo si es necesario.

Antes de poder iniciar las máquinas virtuales en otro host de XenServer, también debe liberar los bloqueos del almacenamiento de las máquinas virtuales. Solo en un host a la vez puede usar cada disco en una SR. Es fundamental hacer que el disco sea accesible para otros hosts de XenServer una vez que se produce un error en un host. Para ello, ejecute el siguiente script en el coordinador del grupo de cada SR que contenga los discos de las máquinas virtuales afectadas: /opt/xensource/sm/resetvdis.py host_UUID SR_UUID master

Solo necesita proporcionar la tercera cadena («maestra») si el host que falló era el coordinador del grupo de SR en el momento del accidente. (El coordinador del grupo SR es el coordinador del grupo o un host de XenServer que utiliza almacenamiento local).

Advertencia:

Asegúrese de que el host esté inactivo antes de ejecutar este comando. El uso incorrecto de este comando puede provocar daños en los datos.

Si intenta iniciar una máquina virtual en otro host de XenServer antes de ejecutar el resetvdis.py script, recibirá el siguiente mensaje de error:. VDI <UUID> already attached RW

Fallos del coordinador de la piscina

Cada miembro de un grupo de recursos contiene toda la información necesaria para asumir el papel de coordinador del grupo si es necesario. Cuando se produce un error en un nodo coordinador de grupos, se produce la siguiente secuencia de eventos:

  1. Si HA está habilitada, se elige automáticamente otro coordinador del grupo.

  2. Si HA no está habilitada, cada miembro espera a que regrese el coordinador del grupo.

Si el coordinador de la agrupación vuelve a subir en este punto, restablece la comunicación con sus miembros y el funcionamiento vuelve a la normalidad.

Si el coordinador del grupo está muerto, elija uno de los miembros y ejecute el comando xe pool-emergency-transition-to-master en él. Una vez que se haya convertido en el coordinador de la piscina, ejecute el comando xe pool-recover-slaves y los miembros ahora señalarán al nuevo coordinador de la piscina.

Si repara o reemplaza el host que era el coordinador original del grupo, simplemente puede abrirlo, instalar el software XenServer y agregarlo al grupo. Dado que los hosts XenServer del grupo deben ser homogéneos, no hay necesidad real de convertir al host reemplazado en el coordinador del grupo.

Cuando un host miembro de XenServer pase a ser coordinador de grupos, compruebe que el repositorio de almacenamiento de grupo predeterminado tenga un valor adecuado. Esta comprobación se puede realizar mediante el comando xe pool-param-list y verificando que el parámetro default-SR apunta a un repositorio de almacenamiento válido.

Fallos de agrupación

En el desafortunado caso de que falle toda la agrupación de recursos, debe volver a crear la base de datos del grupo desde cero. Asegúrese de realizar copias de seguridad periódicas de los metadatos de su grupo mediante el comando xe pool-dump-database CLI (consulte pool-dump-database).

Para restaurar un grupo que ha fallado por completo:

  1. Instale un conjunto nuevo de hosts. No los juntes en esta etapa.

  2. Para el host designado como coordinador del grupo, restaure la base de datos del grupo desde la copia de seguridad mediante el comando xe pool-restore-database (consulte pool-restore-database).

  3. Conéctese al coordinador del grupo mediante XenCenter y asegúrese de que todo el almacenamiento compartido y las máquinas virtuales estén disponibles de nuevo.

  4. Realice una operación de unión a un grupo en los hosts miembros recién instalados restantes e inicie las máquinas virtuales en los hosts apropiados.

Hacer frente a la falla debido a errores de configuración

Si la máquina host física está operativa pero la configuración del software o del host está dañada:

  1. Ejecute el siguiente comando para restaurar el software y la configuración del host:

    xe host-restore host=host file-name=hostbackup
    <!--NeedCopy-->
    
  2. Reinicie en el CD de instalación del host y seleccione Restaurar desde la copia de seguridad.

Fallo de máquina física

Si la máquina host física ha fallado, utilice el procedimiento apropiado de la siguiente lista para recuperarse.

Advertencia:

Las máquinas virtuales que se ejecuten en un miembro anterior (o en el host anterior) que hayan fallado seguirán marcadas como Running en la base de datos. Este comportamiento es por seguridad. Iniciar simultáneamente una VM en dos hosts diferentes provocaría una corrupción grave del disco. Si está seguro de que las máquinas (y las máquinas virtuales) están fuera de línea, puede restablecer el estado de energía de la máquina virtual a Halted:

xe vm-reset-powerstate vm=vm_uuid --force

Las máquinas virtuales se pueden reiniciar mediante XenCenter o la CLI.

Para reemplazar un coordinador de grupo fallido por un miembro que aún está en funcionamiento:

  1. Ejecute los comandos siguientes:

    xe pool-emergency-transition-to-master
    xe pool-recover-slaves
    <!--NeedCopy-->
    
  2. Si los comandos se ejecutan correctamente, reinicie las VM.

Para restaurar un grupo con todos los hosts fallidos:

  1. Ejecute el comando:

    xe pool-restore-database file-name=backup
    <!--NeedCopy-->
    

    Advertencia:

    Este comando solo se ejecuta correctamente si el equipo de destino tiene un número adecuado de NIC con el nombre adecuado.

  2. Si la máquina de destino tiene una vista del almacenamiento diferente a la de la máquina original, modifique la configuración de almacenamiento mediante el comando pbd-destroy. A continuación, ejecute el comando pbd-create para volver a crear configuraciones de almacenamiento. Consulte comandos pbd para obtener documentación de estos comandos.

  3. Si ha creado una configuración de almacenamiento, utilice pbd-plug o el elemento de menú Almacenamiento > Reparar repositorio de almacenamiento en XenCenter para usar la nueva configuración.

  4. Reinicie todas las VM.

Para restaurar una VM cuando el almacenamiento de VM no esté disponible:

  1. Ejecute este comando:

    xe vm-import filename=backup metadata=true
    <!--NeedCopy-->
    
  2. Si la importación de metadatos falla, ejecute el comando:

    xe vm-import filename=backup metadata=true --force
    <!--NeedCopy-->
    

    Este comando intenta restaurar los metadatos de la máquina virtual según el “mejor esfuerzo”.

  3. Reinicie todas las VM.

Hacer frente a los fallos de las