Solución de problemas de grupos agrupados
Importante:
La actualización acumulativa 1 de Citrix Hypervisor 8.2 llega al final de su vida útil el 25 de junio de 2025. Planifique su actualización a XenServer 8 ahora para garantizar una transición fluida y un soporte continuo. Para obtener más información, consulte Actualizar.
Si utiliza los archivos de licencia de Citrix Virtual Apps and Desktops para licenciar los hosts de Citrix Hypervisor 8.2 Cumulative Update 1, estos archivos de licencia no son compatibles con XenServer 8. Antes de actualizar, debe adquirir los archivos de licencia de socket de XenServer Premium Edition para utilizarlos con XenServer 8. Estos archivos de licencia de socket están disponibles como un derecho de las suscripciones de Citrix para Private Cloud, Citrix Universal Hybrid Multi-Cloud, Citrix Universal MSP y Citrix Platform License para ejecutar sus cargas de trabajo de Citrix. Los clientes de Citrix que aún no hayan realizado la transición a estas nuevas suscripciones pueden solicitar participar en una promoción gratuita de 10.000 licencias de socket de XenServer Premium Edition. Para obtener más información, consulte XenServer.
Si no obtiene una licencia compatible para XenServer 8 antes de actualizar, cuando actualice sus hosts, estos volverán a la edición de prueba de 90 días. La Edición de Prueba ofrece las mismas características que la Edición Premium con algunas limitaciones. Para obtener más información, consulte Descripción general de las licencias de XenServer 8.
Los grupos de Citrix Hypervisor que utilizan GFS2 para aprovisionar su almacenamiento en bloque compartido se agrupan en clústeres. Estos pools se comportan de forma diferente a los pools que utilizan el almacenamiento compartido basado en archivos o LVM con almacenamiento en bloque compartido. Como resultado, hay algunos problemas específicos que pueden ocurrir en los grupos agrupados de Citrix Hypervisor y los entornos GFS2.
Utilice la siguiente información para solucionar problemas menores que puedan producirse al utilizar esta función.
Todos mis hosts pueden hacer ping entre sí, pero no puedo crear un clúster. ¿Por qué?
El mecanismo de agrupación en clústeres utiliza puertos específicos. Si los hosts no pueden comunicarse en estos puertos (incluso si pueden comunicarse en otros puertos), no puede habilitar la agrupación en clústeres para el grupo.
Asegúrese de que los hosts del grupo puedan comunicarse en los siguientes puertos:
- TCP: 8892, 8896, 21064
- UDP: 5404, 5405 (no multidifusión)
Si hay firewalls o similares entre los hosts del grupo, asegúrese de que estos puertos estén abiertos.
Si ha configurado previamente HA en el grupo, deshabilite la HA antes de habilitar la agrupación en clústeres.
¿Por qué recibo un error al intentar unir un nuevo host a un grupo de clústeres existente?
Cuando la agrupación en clústeres está habilitada en un grupo, cada cambio de pertenencia al grupo debe ser acordado por todos los miembros del clúster para que pueda realizarse correctamente. Si no se puede contactar con un miembro del clúster, se produce un error en las operaciones que cambian la pertenencia al clúster (como la adición o eliminación de host).
Para agregar el nuevo host al grupo agrupado:
-
Asegúrese de que todos sus anfitriones estén en línea y puedan ser contactados.
-
Asegúrese de que los hosts del grupo puedan comunicarse en los siguientes puertos:
- TCP: 8892, 8896, 21064
- UDP: 5404, 5405 (no multidifusión)
-
Asegúrese de que el host de unión tenga una dirección IP asignada en la NIC que se une a la red de clúster del grupo.
-
Asegúrese de que ningún host del grupo esté sin conexión cuando un nuevo host intente unirse al grupo agrupado.
-
Si no se puede recuperar un host sin conexión, márquelo como inactivo para eliminarlo del clúster. Para obtener más información, consulte Un host de mi grupo agrupado está sin conexión y no puedo recuperarlo. ¿Cómo elimino el host de mi clúster?
¿Qué hago si algunos miembros del grupo agrupado no se unen automáticamente al clúster?
Este problema puede deberse a que los miembros del grupo agrupado pierden la sincronización.
Para volver a sincronizar los miembros del grupo agrupado, utilice el siguiente comando:
xe cluster-pool-resync cluster-uuid=<cluster_uuid>
Si el problema persiste, puede intentar volver a conectar el GFS2 SR. Puede realizar esta tarea mediante la CLI de xe o a través de XenCenter.
Vuelva a conectar el GFS2 SR mediante la CLI xe:
-
Desconecte el GFS2 SR de la piscina. En cada host, ejecute el comando xe CLI
xe pbd-desenchufar uuid=<uuid_of_pbd>
. -
Deshabilite el grupo agrupado mediante el comando
xe cluster-pool-destroy cluster-uuid=<cluster_uuid>
Si el comando anterior no se ejecuta correctamente, puede deshabilitar a la fuerza un grupo agrupado mediante la ejecución de
xe cluster-host-force-destroy uuid=<cluster_host>
en cada anfitrión de la piscina. -
Vuelva a habilitar el grupo agrupado mediante el comando
xe cluster-pool-create network-uuid={\[--lt--]}network_uuid> [pila de clúster=cluster_stack\] \[tiempo de espera de token=token_timeout\] [token-timeout-coefficient=token_timeout_coefficient]
-
Vuelva a conectar el GFS2 SR ejecutando el comando
xe pbd-plug uuid=<uuid_of_pbd>
en cada host.
Como alternativa, puede utilizar XenCenter para volver a conectar el GFS2 SR:
- En la piscina Almacenamiento , haga clic con el botón derecho en el GFS2 SR y seleccione Separar….
- En la barra de herramientas, seleccione Piscina > Propiedades.
- En Agrupamiento tabulación, anule la selección Habilitación de la agrupación en clústeres.
- Clic De acuerdo para aplicar el cambio.
- En la barra de herramientas, seleccione Piscina > Propiedades.
- En Agrupamiento , seleccione Habilitación de la agrupación en clústeres y elija la red que se utilizará para la agrupación en clústeres.
- Clic De acuerdo para aplicar el cambio.
- En la piscina Almacenamiento , haga clic con el botón derecho en el GFS2 SR y seleccione Reparar.
¿Cómo puedo saber si mi anfitrión se ha autocercado?
Si el host se autoprotegió, es posible que se haya vuelto a unir al clúster cuando se reinició. Para ver si un anfitrión se ha autocercado y se ha recuperado, puede consultar el archivo /var/opt/xapi-clusterd/boot-times
para ver las horas en que se inició el host. Si hay horas de inicio en el archivo que no esperaba ver, el host se ha autocercado.
¿Por qué mi host está desconectado? ¿Cómo puedo recuperarlo?
Hay muchas razones posibles para que un host se desconecte. Dependiendo del motivo, el host se puede recuperar o no.
Las siguientes razones por las que un host está sin conexión son más comunes y se pueden solucionar recuperando el host:
- Apagado limpio
- Apagado forzado
- Fallo temporal de energía
- Reiniciar
Las siguientes razones por las que un host está sin conexión son menos comunes:
- Error permanente de hardware del host
- Falla permanente de la fuente de alimentación del host
- Partición de red
- Falla del conmutador de red
Estos problemas se pueden solucionar reemplazando el hardware o marcando los hosts fallidos como inactivos.
Un host de mi grupo agrupado está sin conexión y no puedo recuperarlo. ¿Cómo elimino el host de mi clúster?
Puede decirle al clúster que olvide el host. Esta acción quita el host del clúster de forma permanente y disminuye el número de hosts activos necesarios para el quórum.
Para eliminar un host irrecuperable, utilice el siguiente comando:
xe host-forget uuid=<host_uuid>
Este comando quita el host del clúster de forma permanente y disminuye el número de hosts activos necesarios para el quórum.
Nota: No
Si el host no está sin conexión, este comando puede provocar la pérdida de datos. Se le pedirá que confirme que está seguro antes de continuar con el comando.
Una vez que un host se marca como inactivo, no se puede volver a agregar al clúster. Para volver a agregar este host al clúster, debe realizar una instalación nueva de Citrix Hypervisor en el host.
He reparado un host que estaba marcado como muerto. ¿Cómo puedo volver a agregarlo a mi clúster?
Un host de Citrix Hypervisor que se ha marcado como inactivo no se puede volver a agregar al clúster. Para volver a agregar este sistema al clúster, debe realizar una instalación nueva de XenServer. Esta nueva instalación aparece en el clúster como un nuevo host.
¿Qué hago si mi clúster sigue perdiendo quórum y sus hosts siguen bloqueando?
Si uno o más de los hosts de Citrix Hypervisor en el clúster entran en un bucle de valla debido a la pérdida y ganancia continua de quórum, puede iniciar el host con el nocluster
argumento de la línea de comandos del kernel. Conéctese a la consola física o serial del host y edite los argumentos de arranque en grub.
Ejemplo :
/boot/grub/grub.cfg
menuentry 'XenServer' {
search --label --set root root-oyftuj
multiboot2 /boot/xen.gz dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G console=vga vga=mode-0x0311
module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable xencons=hvc console=hvc0 console=tty0 quiet vga=785 splash plymouth.ignore-serial-consoles nocluster
module2 /boot/initrd-4.4-xen.img
}
menuentry 'Citrix Hypervisor (Serial)' {
search --label --set root root-oyftuj
multiboot2 /boot/xen.gz com1=115200,8n1 console=com1,vga dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G
module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable console=tty0 xencons=hvc console=hvc0 nocluster
module2 /boot/initrd-4.4-xen.img
}
<!--NeedCopy-->
¿Qué sucede cuando el maestro de grupo se reinicia en un grupo agrupado?
En la mayoría de los casos, el comportamiento cuando el grupo principal se apaga o se reinicia en un grupo agrupado es el mismo que cuando otro miembro del grupo se apaga o se reinicia.
La forma en que se apaga o reinicia el host puede afectar al quórum del grupo agrupado. Para obtener más información sobre el cuórum, consulte Quórum.
La única diferencia en el comportamiento depende de si HA está habilitado en el grupo:
- Si HA está habilitado, se selecciona un nuevo maestro y se mantiene el servicio general.
- Si HA no está habilitado, no hay ningún maestro para el grupo. Las máquinas virtuales en ejecución en los hosts restantes continúan ejecutándose. La mayoría de las operaciones administrativas no están disponibles hasta que se reinicia el maestro.
¿Por qué ha desaparecido mi grupo después de que un host del grupo agrupado se vea obligado a cerrarse?
Si apaga un host normalmente (no a la fuerza), se quita temporalmente de los cálculos de quórum hasta que se vuelva a activar. Sin embargo, si apaga a la fuerza un host o pierde energía, ese host sigue contando para los cálculos de quórum. Por ejemplo, si tenía un grupo de 3 hosts y forzó el cierre de 2 de ellos, los límites de host restantes porque ya no tienen quórum.
Intente apagar siempre los hosts de un grupo agrupado de forma limpia. Para obtener más información, consulte Administre su grupo agrupado.
¿Por qué se reiniciaron todos los hosts del grupo agrupado al mismo tiempo?
Se considera que todos los hosts de un clúster activo han perdido quórum cuando el número de hosts con los que se puede contactar en el grupo es inferior a estos valores:
- Para un grupo con un número par de hosts: n/2
- Para un grupo con un número impar de hosts: (n+1)/2
La letra n indica el número total de hosts en el grupo agrupado. Para obtener más información sobre el cuórum, consulte Quórum.
En esta situación, todos los hosts se autodelimitan y verá que todos los hosts se reinician.
Para diagnosticar por qué el grupo perdió quórum, la siguiente información puede ser útil:
- En XenCenter, compruebe la casilla Notificaciones para el momento del problema para ver si se produjo el autocercado.
- En los hosts del clúster, compruebe
/var/opt/xapi-clusterd/boot-times
para ver si se ha producido un reinicio en un momento inesperado. - En
Crit.log
, compruebe si se genera algún mensaje de autobloqueo. -
Revise el
Estado dlm_tool
para la información de cercado.Ejemplo
Estado dlm_tool
salida:dlm_tool status cluster nodeid 1 quorate 1 ring seq 8 8 daemon now 4281 fence_pid 0 node 1 M add 3063 rem 0 fail 0 fence 0 at 0 0 node 2 M add 3066 rem 0 fail 0 fence 0 at 0 0 <!--NeedCopy-->
Al recopilar registros para la depuración, recopile información de diagnóstico de todos los hosts del clúster. En el caso de que un solo host se haya autocercado, es más probable que los demás hosts del clúster tengan información útil.
Recopile informes completos del estado del servidor para los hosts del grupo en clúster. Para obtener más información, consulte Informes de estado del servidor Citrix Hypervisor.
¿Por qué no puedo recuperar mi grupo agrupado cuando tengo quórum?
Si tiene un grupo agrupado con un número par de hosts, el número de hosts necesarios para lograr el quórum es uno más que el número de hosts necesarios para retener quórum. Para obtener más información sobre el cuórum, consulte Quórum.
Si se encuentra en un grupo de números pares y ha recuperado la mitad de los hosts, debe recuperar un host más antes de poder recuperar el clúster.
Token no válido
¿Error al cambiar la configuración del clúster?
¿Por qué veo un Al actualizar la configuración del clúster, es posible que reciba el siguiente mensaje de error sobre un token no válido ("[[\"InternalError\",\"Token no válido\"]]")
.
Puede resolver este problema completando los siguientes pasos:
-
(Opcional) Realice una copia de seguridad de la configuración actual del clúster mediante la recopilación de un informe de estado del servidor que incluya los registros de xapi-clusterd y del sistema.
-
Utilice XenCenter para desconectar el SR de GFS2 del grupo agrupado.
En la piscina Almacenamiento , haga clic con el botón derecho en el GFS2 SR y seleccione Separar….
-
En cualquier host del clúster, ejecute este comando para destruir el clúster a la fuerza:
xe cluster-pool-force-destroy cluster-uuid=<uuid>
-
Utilice XenCenter para volver a habilitar la agrupación en clústeres en el grupo.
- En la barra de herramientas, seleccione Piscina > Propiedades.
- En Agrupamiento , seleccione Habilitación de la agrupación en clústeres y elija la red que se utilizará para la agrupación en clústeres.
- Clic De acuerdo Para aplicar el cambio
-
Utilice XenCenter para volver a conectar el GFS2 SR al grupo
En la piscina Almacenamiento , haga clic con el botón derecho en el GFS2 SR y seleccione Reparar.
En este artículo
- Todos mis hosts pueden hacer ping entre sí, pero no puedo crear un clúster. ¿Por qué?
- ¿Por qué recibo un error al intentar unir un nuevo host a un grupo de clústeres existente?
- ¿Qué hago si algunos miembros del grupo agrupado no se unen automáticamente al clúster?
- ¿Cómo puedo saber si mi anfitrión se ha autocercado?
- ¿Por qué mi host está desconectado? ¿Cómo puedo recuperarlo?
- Un host de mi grupo agrupado está sin conexión y no puedo recuperarlo. ¿Cómo elimino el host de mi clúster?
- He reparado un host que estaba marcado como muerto. ¿Cómo puedo volver a agregarlo a mi clúster?
- ¿Qué hago si mi clúster sigue perdiendo quórum y sus hosts siguen bloqueando?
- ¿Qué sucede cuando el maestro de grupo se reinicia en un grupo agrupado?
- ¿Por qué ha desaparecido mi grupo después de que un host del grupo agrupado se vea obligado a cerrarse?
- ¿Por qué se reiniciaron todos los hosts del grupo agrupado al mismo tiempo?
- ¿Por qué no puedo recuperar mi grupo agrupado cuando tengo quórum?
- ¿Por qué veo un Token no válido ¿Error al cambiar la configuración del clúster?