XenServer

Supervise los recursos de host y dom0 con NRPE

Nota: No

La función NRPE está disponible para los clientes de XenServer Premium o Trial Edition. Para obtener más información sobre las licencias de XenServer, consulte Licenciamiento. Para actualizar u obtener una licencia de XenServer, visite la página Sitio web de XenServer.

Los usuarios con la función de administrador de grupo pueden utilizar cualquier herramienta de supervisión de terceros que admita Nagios Remote Plugin Executor (NRPE) para supervisar los recursos consumidos por el host de XenServer y dom0, el dominio de control del host.

Puede usar los siguientes complementos de verificación para monitorear los recursos de host y dom0:

Métrica Nombre del cheque NRPE Descripción Umbral de advertencia predeterminado Umbral crítico predeterminado Datos de rendimiento devueltos
Carga de CPU del host check_host_load Obtiene y comprueba la carga actual por CPU física del host, donde la carga hace referencia al número de vCPU en un estado en ejecución o ejecutable. 3 4 Carga actual del sistema de la CPU del host (calculada tomando la carga media de la CPU física del host).
Uso de CPU del host (%) check_host_cpu Obtiene y comprueba el uso medio actual de la CPU del host. 80% 90% El porcentaje de CPU del host que está libre actualmente y el porcentaje que está en uso.
Uso de memoria del host (%) check_host_memory Obtiene y comprueba el uso actual de la memoria del host. 80% 90% El porcentaje de memoria de host que está libre actualmente y el porcentaje que está en uso.
Uso de vGPU del host (%) check_vgpu Obtiene y comprueba todo el uso actual de Nvidia vGPU en ejecución del host. 80% 90% El porcentaje de vGPU en ejecución que está libre actualmente y el porcentaje que está en uso.
Uso de memoria de vGPU del host (%) check_vgpu_memory Obtiene y comprueba todo el uso de memoria Nvidia vGPU en ejecución actual (incluida la memoria compartida y la memoria gráfica) del host. 80% 90% El porcentaje de memoria vGPU en ejecución (incluida la memoria compartida y la memoria gráfica) que está libre actualmente y el porcentaje que está en uso.
Carga de CPU Dom0 check_load Obtiene y comprueba el promedio de carga actual del sistema por CPU de dom0, donde la carga se refiere al número de procesos en un estado en ejecución o ejecutable. 2.7,2.6,2.5 3.2,3.1,3 Los datos de carga de la CPU del host se calculan tomando el promedio de los últimos 1, 5 y 15 minutos.
Uso de CPU Dom0 (%) check_cpu Obtiene y comprueba el uso medio actual de la CPU de dom0. 80% 90% El uso promedio general de CPU de dom0 como porcentaje.
Uso de memoria Dom0 (%) check_memory Obtiene y comprueba el uso actual de la memoria de dom0. 80% 90% El porcentaje de memoria dom0 que está libre actualmente y el porcentaje que está en uso.
Dom0 Intercambio Libre (%) check_swap Obtiene y comprueba el uso actual del intercambio de dom0. 20% 10 % El porcentaje de MB en dom0 que está libre actualmente.
Espacio libre de la partición raíz Dom0 (%) check_disk_root Obtiene y comprueba el uso actual de la partición raíz de dom0. 20% 10 % El porcentaje de MB en la partición raíz dom0 que está libre actualmente.
Espacio libre de partición de registro dom0 (%) check_disk_log Obtiene y comprueba el uso actual de la partición de registro de dom0. 20% 10 % El porcentaje de MB en la partición de registro dom0 que está libre actualmente.
Estado de la pila de herramientas check_xapi Obtiene y comprueba el estado de la pila de herramientas de administración de XenServer (también conocida como XAPI).     El tiempo de actividad de XAPI transcurrió en segundos.
Estado de múltiples rutas check_multipath Obtiene y comprueba el estado de las rutas de almacenamiento.     El estado de las rutas de almacenamiento. De acuerdo indica que todas las rutas están activas, ADVERTENCIA indica que algunas rutas han fallado pero más de una ruta está activa, CRÍTICO indica que solo hay una ruta activa o que todas las rutas han fallado, DESCONOCIDO Indica que las rutas múltiples del host están deshabilitadas y que no se puede obtener el estado de las rutas.

NRPE es un servicio local que se ejecuta en dom0 y escucha en el puerto TCP (predeterminado) 5666 las solicitudes de ejecución de comprobación de una herramienta de supervisión. Una vez que llega una solicitud, NRPE la analiza, encuentra el comando de verificación correspondiente, incluidos los detalles del parámetro, del archivo de configuración y, a continuación, lo ejecuta. El resultado de la comprobación se envía a la herramienta de supervisión, que almacena los resultados de las comprobaciones anteriores y proporciona un gráfico que muestra los datos históricos de rendimiento.

Requisitos previos

Para poder utilizar NRPE para supervisar los recursos de host y dom0, la herramienta de supervisión que está utilizando debe cumplir los siguientes requisitos previos:

  • La herramienta de monitoreo debe ser compatible con la versión 4.1.0 de NRPE.
  • Para permitir la comunicación entre NRPE y la herramienta de supervisión, la herramienta de supervisión debe ser compatible con TLS 1.2 con cifrados ECDHE-RSA-AES256-GCM-SHA384 y ECDHE-RSA-AES128-GCM-SHA256, y la curva EC es SECP384R1.

Restricciones

  • Puede configurar los ajustes de NRPE para un grupo completo o para un host independiente que no forme parte de un grupo. Actualmente, no se pueden configurar los ajustes de NRPE para un host individual en un grupo.
  • Si agrega un host a un grupo que ya tiene NRPE habilitado y configurado en él, XenCenter no aplica automáticamente la configuración de NRPE del grupo al nuevo host. Debe volver a configurar los valores de NRPE en el grupo después de agregar el nuevo host o configurar el nuevo host con la misma configuración de NRPE antes de agregarlo al grupo.

    Nota: No

    Al volver a configurar los ajustes de NRPE en un grupo después de agregar un nuevo host, asegúrese de que el host esté en funcionamiento.

  • Si se elimina un host de un grupo con NRPE habilitado y configurado en él, XenCenter no altera la configuración de NRPE en el host ni en el grupo.

Configuración de NRPE mediante la CLI de xe

Puede configurar NRPE mediante la CLI de xe o XenCenter. Para obtener más información sobre cómo configurar NRPE mediante XenCenter, consulte Supervisión de recursos de host y dom0 con NRPE.

Después de realizar cambios de configuración en NRPE, reinicie el servicio NRPE mediante:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->

Habilitar NRPE

NRPE está deshabilitado de forma predeterminada en XenServer. Para habilitar NRPE en el dominio de control de un host (dom0), ejecute los siguientes comandos en la CLI xe:

  1. Obtenga el UUID del host que desea supervisar:

    xe host-list

  2. Habilite NRPE en el host:

    xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable

    Si la operación se ejecuta correctamente, este comando genera Éxito. Cuando XenServer se reinicia, NRPE se inicia automáticamente.

Para detener, iniciar, reiniciar o deshabilitar NRPE:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->

Dónde operación es parar, empezar, reanudaro inutilizar.

Supervisión de servidores

Se trata de una lista delimitada por comas de direcciones IP o nombres de host que pueden comunicarse con el demonio NRPE. Direcciones de red con una máscara de bits (por ejemplo 192.168.1.0/24) también son compatibles.

Vea la lista actual de servidores de monitoreo:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->

Permitir que la herramienta de supervisión ejecute comprobaciones:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->

Consulte todas las configuraciones de NRPE:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->

Configure varios ajustes de NRPE:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->

Registros

Registro de depuración

De forma predeterminada, el registro de depuración está deshabilitado.

Para comprobar si el registro de depuración está habilitado, ejecute el siguiente comando:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->

Si depuración: 0 , se deshabilita el registro de depuración.

Para habilitar el registro de depuración:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->

Registro SSL

De forma predeterminada, el registro SSL está deshabilitado:

  ssl_logging=0x00
<!--NeedCopy-->

Para comprobar si el registro SSL está habilitado, ejecute el siguiente comando:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->

Para habilitar el registro SSL:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->

Umbrales de alerta y críticos

Para algunos de estos complementos de comprobación, puede establecer valores de umbral crítico y de advertencia para que si el valor devuelto por un complemento de verificación supera los valores de umbral, se genere una alerta. El umbral de advertencia indica un problema potencial y el umbral crítico indica un problema más grave que requiere atención inmediata. Aunque se establecen valores predeterminados para los umbrales de advertencia y críticos, puede ajustar los valores de umbral.

Para consultar los valores predeterminados de advertencia y umbral crítico para todas las comprobaciones, ejecute el siguiente comando xe CLI que devuelve una lista de todas las comprobaciones y sus umbrales críticos y de advertencia asociados:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->

También puede consultar los valores de umbral para una comprobación específica. Por ejemplo, para obtener los valores de umbral crítico y de advertencia para el check_memory check plugin, ejecute el siguiente comando xe CLI:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->

También puede cambiar el valor predeterminado de un umbral. Por ejemplo, para cambiar los valores de umbral predeterminados para el check_memory check plugin, ejecute el siguiente comando xe CLI:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->
Supervise los recursos de host y dom0 con NRPE