Supervise y administre su implementación
XenServer proporciona una supervisión detallada de las métricas de rendimiento. Estas métricas incluyen información de CPU, memoria, disco, red, estado C/estado P y almacenamiento. Cuando corresponda, estas métricas están disponibles por host y por VM. Estas métricas están disponibles directamente o se puede acceder a ellas y verlas gráficamente en XenCenter u otras aplicaciones de terceros.
XenServer también proporciona alertas del sistema y del rendimiento. Las alertas son notificaciones que se producen en respuesta a eventos del sistema seleccionados. Estas notificaciones también se producen cuando uno de los siguientes valores supera un umbral específico en un host administrado, VM o repositorio de almacenamiento: uso de la CPU, uso de la red, uso de la memoria, uso de la memoria del dominio de control, rendimiento del almacenamiento o uso del disco de la máquina virtual. Puede configurar las alertas mediante la CLI xe o XenCenter. Para crear notificaciones basadas en cualquiera de las métricas de rendimiento de máquinas virtuales o hosts disponibles, consulte Alertas de rendimiento.
Supervise el rendimiento de XenServer
Los clientes pueden supervisar el rendimiento de sus hosts y máquinas virtuales (VM) de XenServer mediante las métricas expuestas en las bases de datos Round Robin (RRD). Estas métricas se pueden consultar a través de HTTP o a través de la herramienta RRD2CSV. Además, XenCenter usa estos datos para producir gráficos de rendimiento del sistema. Para obtener más información, consulte Analizar y visualizar métricas.
En las tablas siguientes se enumeran todas las métricas de host y VM disponibles.
Notas:
- La latencia durante un período se define como la latencia promedio de las operaciones durante ese período.
- La disponibilidad y la utilidad de ciertas métricas dependen de la SR y la CPU.
Métricas de host disponibles
Nombre de métrica | Descripción | Condición | Nombre de XenCenter |
---|---|---|---|
avgqu_sz_<sr-uuid-short> |
Tamaño medio de cola de E/S (solicitudes). | Al menos un VBD conectado en <sr-uuid-short> de SR en el host |
sr-uuid-short Tamaño de cola |
cpu<cpu>-C<cstate> |
Tiempo que la CPU cpu pasa en estado C cstate en milisegundos. |
El estado C existe en la CPU | Estado C cstate de CPU cpu
|
cpu<cpu>-P<pstate> |
Tiempo que la CPU cpu pasa en estado P pstate en milisegundos. |
El estado P existe en la CPU | Estado P pstate de CPU cpu
|
cpu<cpu> |
Utilización de CPU física cpu (fracción). Habilitado de forma predeterminada. |
La CPU cpu existe |
CPU cpu
|
cpu_avg |
Utilización media de las CPU físicas (fracción). Habilitado de forma predeterminada. | Ninguno | CPU promedio |
hostload |
Carga de host por CPU física, donde la carga se refiere a la cantidad de vCPU en estado de ejecución o ejecutables. | Ninguno | Carga de la CPU del host |
inflight_<sr-uuid-short> |
Número de solicitudes de E/S actualmente en curso. Habilitado de forma predeterminada. | Al menos un VBD conectado en sr de SR en el host |
sr Solicitudes en proceso |
io_throughput_read_<sr-uuidshort> |
Datos leídos de SR (MiB/s). | Al menos un VBD conectado en sr de SR en el host |
sr Rendimiento de lectura |
io_throughput_write_<sr-uuidshort> |
Datos escritos en el SR (MiB/s). | Al menos un VBD conectado en sr de SR en el host |
sr Rendimiento de escritura |
io_throughput_total_<sr-uuidshort> |
Todas las E/S de SR (MiB/s). | Al menos un VBD conectado en sr de SR en el host |
sr Rendimiento total |
iops_read_<sr-uuid-short> |
Lee las solicitudes por segundo. | Al menos un VBD conectado en sr de SR en el host |
sr Leer IOPS |
iops_write_<sr-uuid-short> |
Solicitudes de escritura por segundo. | Al menos un VBD conectado en sr de SR en el host |
sr Escritura de IOPS |
iops_total_<sr-uuid-short> |
Solicitudes de E/S por segundo. | Al menos un VBD conectado en sr de SR en el host |
sr IOPS totales |
iowait_<sr-uuid-short> |
Porcentaje del tiempo de espera de E/S. | Al menos un VBD conectado en sr de SR en el host |
sr E/S espera |
latency_<sr-uuid-short> |
Latencia de E/S promedio (milisegundos). | Al menos un VBD conectado en sr de SR en el host |
sr Latencia |
loadavg |
Promedio de carga de Domain0. Habilitada de forma predeterminada | Ninguno | Carga de dominio de control |
memory_free_kib |
Cantidad total de memoria libre (KiB). Habilitado de forma predeterminada. | Ninguno | No está presente en XenCenter. Sustituido por memoria usada. |
La pila de herramientas no lo informa. Calculado por XenCenter. | Cantidad total de memoria utilizada (KiB). Habilitado de forma predeterminada. | Ninguno | Memoria usada |
memory_reclaimed |
Memoria del host recuperada por squeeze (B). | Ninguno | Memoria recuperada |
memory_reclaimed_max |
Memoria host disponible para recuperar con squeeze (B). | Ninguno | Memoria recuperada potencial |
memory_total_kib |
Cantidad total de memoria (KiB) en el host. Habilitado de forma predeterminada. | Ninguno | Memoria total |
network/latency |
Intervalo en segundos entre los dos últimos latidos transmitidos desde el anfitrión local a todos los servidores en línea. Inhabilitado de forma predeterminada. | HA habilitado | Latencia de red |
statefile/<vdi_uuid>/latency |
Tiempo de respuesta en segundos del último acceso a archivos de estado desde el host local. Inhabilitado de forma predeterminada. | HA habilitado | Latencia de archivos de estado HA |
pif_<pif>_rx |
Bytes por segundo recibidos en la interfaz física pif . Habilitado de forma predeterminada. |
Existe PIF |
XenCenter-pifname Recibir (ver nota) |
pif_<pif>_tx |
Bytes por segundo enviados en la interfaz física pif . Habilitado de forma predeterminada. |
Existe PIF |
XenCenter-pifname Enviar (ver nota) |
pif_<pif>_rx_errors |
Recibir errores por segundo en la interfaz física pif . Inhabilitado de forma predeterminada. |
Existe PIF |
XenCenter-pifname Errores de recepción (ver nota) |
pif_<pif>_tx_errors |
Transmitir errores por segundo en la interfaz física pif . Inhabilitado de forma predeterminada |
Existe PIF |
XenCenter-pifname Errores de envío (ver nota) |
pif_aggr_rx |
Bytes por segundo recibidos en todas las interfaces físicas. Habilitado de forma predeterminada. | Ninguno | Recepción total de NIC |
pif_aggr_tx |
Bytes por segundo enviados en todas las interfaces físicas. Habilitado de forma predeterminada. | Ninguno | Envío NIC total |
pvsaccelerator_evicted |
Bytes por segundo expulsados de la memoria caché | PVSAccelerator habilitado | Tasa de desalojos del acelerador de PV |
pvsaccelerator_read_hits |
Lecturas por segundo servidas desde la memoria caché | PVSAccelerator habilitado | Tasa de aciertos del acelerador PVS |
pvsaccelerator_read_misses |
Lecturas por segundo que no se pueden servir desde la memoria caché | PVSAccelerator habilitado | Tasa de fallos del acelerador PVS |
pvsaccelerator_traffic_client_sent |
Bytes por segundo enviados por clientes PVS almacenados en caché | PVSAccelerator habilitado | PVS-Accelerator observó tráfico de red de los clientes |
pvsaccelerator_traffic_server_sent |
Bytes por segundo enviados por servidores PVS almacenados en caché | PVSAccelerator habilitado | PVS-Accelerator observó tráfico de red desde los servidores |
pvsaccelerator_read_total |
Lecturas por segundo observadas por la memoria caché | PVSAccelerator habilitado | Velocidad de lectura observada del acelerador PVS |
pvsaccelerator_traffic_proxy_saved |
Bytes por segundo enviados por PVSAccelerator en lugar del servidor PVS | PVSAccelerator habilitado | PVS-Accelerator ahorra tráfico de red |
pvsaccelerator_space_utilization |
Porcentaje de espacio utilizado por PVSAccelerator en este host, en comparación con el tamaño total del almacenamiento en caché | PVSAccelerator habilitado | Utilización del espacio del acelerador PVS |
running_vcpus |
La cantidad total de vCPU en ejecución | Ninguno | Cantidad de vCPU en ejecución |
running_domains |
La cantidad total de dominios en ejecución, incluido dom0 (el dominio de control del host) | Ninguno | Cantidad de dominios en ejecución |
sr_<sr>_cache_size |
Tamaño en bytes de IntelliCache SR. Habilitado de forma predeterminada. | IntelliCache habilitado | Tamaño de caché de IntelliCache |
sr_<sr>_cache_hits |
Visitas de caché por segundo. Habilitado de forma predeterminada. | IntelliCache habilitado | Visitas de caché de IntelliCache |
sr_<sr>_cache_misses |
Fallos de caché por segundo. Habilitado de forma predeterminada. | IntelliCache habilitado | Falta de caché de IntelliCache |
xapi_allocation_kib |
Asignación de memoria (KiB) realizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Asignación de memoria de |
xapi_free_memory_kib |
Memoria libre (KiB) disponible para el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Memoria de agente libre |
xapi_healthcheck/latency |
Tiempo de respuesta en segundos de la última llamada de supervisión de estado de XAPI en el host local. Inhabilitado de forma predeterminada. | Alta disponibilidad habilitada | Latencia de alta disponibilidad de XenServer |
xapi_live_memory_kib |
Memoria en vivo (KiB) utilizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Memoria del agente en vivo |
xapi_memory_usage_kib |
Memoria total (KiB) asignada utilizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Uso de memoria del agente |
Métricas de VM disponibles
Nombre de métrica | Descripción | Condición | Nombre de XenCenter |
---|---|---|---|
cpu<cpu> |
Utilización de vCPU cpu (fracción). Habilitada de forma predeterminada |
La vCPU cpu existe |
CPU |
cpu_usage |
Uso de la CPU del dominio | Ninguno | cpu_usage |
memory |
Memoria asignada actualmente a la VM (bytes) .Habilitada de forma predeterminada | Ninguno | Memoria total |
memory_target |
Destino del controlador de globo de máquina virtual (bytes). Habilitada de forma predeterminada | Ninguno | Objetivo de memoria |
memory_internal_free |
Memoria utilizada según lo informado por el agente invitado (KiB). Habilitada de forma predeterminada | Ninguno | Memoria libre |
runstate_fullrun |
Fracción de tiempo que se ejecutan todas las vCPU. | Ninguno | Ejecución completa de vCPU |
runstate_full_contention |
Fracción de tiempo que se pueden ejecutar todas las vCPU (es decir, esperando la CPU) | Ninguno | Contención completa de vCPUs |
runstate_concurrency_hazard |
Fracción de tiempo que algunas CPU virtuales se ejecutan y otras se pueden ejecutar | Ninguno | Riesgo de concurrencia de CPU |
runstate_blocked |
Fracción de tiempo que todas las vCPU están bloqueadas o sin conexión | Ninguno | vCPU inactivas |
runstate_partial_run |
Fracción de tiempo que algunas CPU virtuales se ejecutan y otras están bloqueadas | Ninguno | Ejecución parcial de vCPU |
runstate_partial_contention |
Fracción de tiempo que algunas CPU virtuales se pueden ejecutar y otras están bloqueadas | Ninguno | Conflicto parcial de vCPU |
vbd_<vbd>_write |
Escribe en el dispositivo vbd en bytes por segundo. Habilitada de forma predeterminada |
El VBD vbd existe |
Escritura vbd en disco |
vbd_<vbd>_read |
Lee desde el dispositivo vbd en bytes por segundo. Habilitado de forma predeterminada. |
El VBD vbd existe |
Lectura vbd de disco |
vbd_<vbd>_write_latency |
Escribe en el dispositivo vbd en microsegundos. |
El VBD vbd existe |
Latencia de escritura en disco vbd
|
vbd_<vbd>_read_latency |
Lee desde el dispositivo vbd en microsegundos. |
El VBD vbd existe |
Latencia de lectura de disco vbd
|
vbd <vbd>_iops_read |
Lee las solicitudes por segundo. | Al menos un VBD conectado para VDI no ISO en el host | IOPS de lectura de disco vbd
|
vbd <vbd>_iops_write |
Solicitudes de escritura por segundo. | Al menos un VBD conectado para VDI no ISO en el host | IOPS de escritura en disco vbd
|
vbd <vbd>_iops_total |
Solicitudes de E/S por segundo. | Al menos un VBD conectado para VDI no ISO en el host | IOPS totales de disco vbd
|
vbd <vbd>_iowait |
Porcentaje de tiempo de espera de I/0. | Al menos un VBD conectado para VDI no ISO en el host | Espera de E/S de disco vbd
|
vbd <vbd>_inflight |
Número de solicitudes de E/S actualmente en curso. | Al menos un VBD conectado para VDI no ISO en el host | Solicitudes en proceso de disco vbd
|
vbd <vbd>_avgqu_sz |
Tamaño de cola de E/S promedio. | Al menos un VBD conectado para VDI no ISO en el host | Tamaño de cola de disco vbd
|
vif_<vif>_rx |
Bytes por segundo recibidos en el número de interfaz virtual vif . Habilitado de forma predeterminada. |
La VIF vif existe |
vif Recibir |
vif_<vif>_tx |
Bytes por segundo transmitidos en la interfaz virtual vif . Habilitado de forma predeterminada. |
La VIF vif existe |
vif Enviar |
vif_<vif>_rx_errors |
Recibe errores por segundo en la interfaz virtual vif . Habilitado de forma predeterminada. |
La VIF vif existe |
vif Recibir errores |
vif_<vif>_tx_errors |
Transmite errores por segundo en la interfaz virtual vif Habilitado de forma predeterminada. |
La VIF vif existe |
vif Enviar errores |
Nota:
El valor de
<XenCenter-pif-name>
puede ser cualquiera de los siguientes:
NIC <pif>
: Si<pif>
contienepif_eth#
, donde##
es 0—9<pif>
: Si<pif>
contienepif_eth#.##
opif_xenbr##
opif_bond##
<Internal> Network <pif>
: Si<pif>
contienepif_xapi##
, (tenga en cuenta que<Internal>
aparece tal cual)TAP <tap>
: Si<pif>
contienepif_tap##
xapi Loopback
: Si<pif>
contienepif_lo
Analice y visualice métricas
La ficha Rendimiento de XenCenter proporciona supervisión en tiempo real de las estadísticas de rendimiento en los grupos de recursos, además de las tendencias gráficas del rendimiento de las máquinas virtuales y físicas. Los gráficos que muestran la CPU, la memoria, la red y la E/S de disco se incluyen en la ficha Rendimiento de forma predeterminada. Puede agregar más métricas, cambiar el aspecto de las gráficas existentes o crear otras adicionales. Para obtener más información, consulte Configuración de métricas en la siguiente sección.
-
Puede ver hasta 12 meses de datos de rendimiento y hacer zoom para observar más de cerca los picos de actividad.
-
XenCenter puede generar alertas de rendimiento cuando el uso de CPU, memoria, E/S de red, E/S de almacenamiento o E/S de disco supera un umbral específico en un host, máquina virtual o SR. Para obtener más información, consulte Alertas en la siguiente sección.
Nota:
Instale XenServer VM Tools para ver todos los datos de rendimiento de las máquinas virtuales.
Configurar gráficos de rendimiento
Para agregar un gráfico:
-
En la ficha Rendimiento, haga clic en Acciones y, a continuación, en Nuevo gráfico. Se muestra el cuadro de diálogo Nuevo gráfico.
-
En el campo Nombre, introduzca un nombre para la gráfica.
-
En la lista de Fuentes de datos, seleccione las casillas de verificación de las fuentes de datos que quiere incluir en el gráfico.
-
Haga clic en Guardar.
Para modificar un gráfico existente:
-
Vaya a la ficha Rendimiento y seleccione el gráfico que quiere modificar.
-
Haga clic con el botón secundario en el gráfico y seleccione Acciones, o haga clic en el botón Acciones. A continuación, selecciona Modificar gráfico.
-
En la ventana de detalles del gráfico, realice los cambios necesarios y haga clic en Aceptar.
Configurar el tipo de gráfico
Los datos de los gráficos de rendimiento se pueden mostrar como líneas o áreas. Para cambiar el tipo de gráfica:
-
En el menú Herramientas, haga clic en Opciones y seleccione Gráficas.
-
Para ver los datos de rendimiento como un gráfico de líneas, haga clic en la opción Gráfico de líneas.
-
Para ver los datos de rendimiento como un gráfico de área, haga clic en la opción Gráfico de área.
-
Haga clic en OK para guardar los cambios.
Los detalles completos para configurar y ver gráficos de rendimiento de XenCenter se pueden encontrar en la documentación de XenCenter en la sección Supervisión del rendimiento del sistema.
Configurar métricas
Nota:
Los estados C y P son funciones de administración de energía de algunos procesadores. El rango de estados disponibles depende de las capacidades físicas del host, así como de la configuración de administración de energía.
Los comandos de host y VM devuelven lo siguiente:
-
Descripción completa de la fuente de datos
-
Las unidades aplicadas a la métrica
-
El rango de valores posibles que se pueden usar
Por ejemplo:
name_label: cpu0-C1
name_description: Proportion of time CPU 0 spent in C-state 1
enabled: true
standard: true
min: 0.000
max: 1.000
units: Percent
<!--NeedCopy-->
Habilitar una métrica específica
La mayoría de las métricas están habilitadas y recopiladas de forma predeterminada. Para habilitar las métricas que no lo están, introduzca lo siguiente:
xe host-data-source-record data-source=metric name host=hostname
<!--NeedCopy-->
Desactivar una métrica específica
Es posible que no quieras recopilar determinadas métricas con regularidad. Para inhabilitar una métrica previamente habilitada, introduzca lo siguiente:
xe host-data-source-forget data-source=metric name host=hostname
<!--NeedCopy-->
Mostrar una lista de métricas de host habilitadas actualmente
Para enumerar las métricas de host que se están recopilando actualmente, introduce lo siguiente:
xe host-data-source-list host=hostname
<!--NeedCopy-->
Mostrar una lista de métricas de VM habilitadas actualmente
Para alojar las métricas de VM que se recopilan actualmente, introduzca lo siguiente:
xe vm-data-source-list vm=vm_name
<!--NeedCopy-->
Usar RRD
XenServer usa los RRD para almacenar las métricas de rendimiento. Estos RRD consisten en varios archivos Round Robin (RRA) en una base de datos de tamaño fijo.
Cada archivo de la base de datos muestrea su métrica particular en una granularidad específica:
- Cada 5 segundos durante 10 minutos
- Cada minuto de las últimas dos horas
- Cada hora de la semana pasada
- Todos los días del año pasado
El muestreo que se lleva a cabo cada cinco segundos registra los puntos de datos reales; sin embargo, los siguientes RRA utilizan funciones de consolidación en su lugar. Las funciones de consolidación que admite XenServer son:
- PROMEDIO
- MIN
- MÁXIMO
Existen RRD para máquinas virtuales individuales (incluida dom0) y para el host de XenServer. Los RRD de VM se almacenan en el host en el que se ejecutan o en el coordinador del grupo cuando no se están ejecutando. Por lo tanto, se debe conocer la ubicación de una VM para recuperar los datos de rendimiento asociados.
Para obtener información detallada sobre cómo usar los RRD de XenServer, consulte la Guía del kit de desarrollo de software de XenServer.
Analizar RRD mediante HTTP
Puede descargar los RRD a través de HTTP desde el host de XenServer especificado mediante el controlador HTTP registrado en o. /host_rrd
/vm_rrd
Ambas direcciones requieren autenticación mediante autenticación HTTP o proporcionando referencias de sesión de API de administración válidas como argumento de consulta. Por ejemplo:
Descargar un RRD de host.
wget http://server/host_rrd?session_id=OpaqueRef:SESSION HANDLE>
<!--NeedCopy-->
Descargar un RRD de VM.
wget http://server/vm_rrd?session_id=OpaqueRef:SESSION HANDLE>&uuid=VM UUID>
<!--NeedCopy-->
Ambas llamadas descargan XML en un formato que puede importarse en rrdtool
para análisis o analizarse directamente.
Analizar los RRD mediante rrd2csv
Además de ver las métricas de rendimiento en XenCenter, la herramienta rrd2csv registra los RRD en formato de valores separados por comas (CSV). Se proporcionan páginas de manual y de ayuda. Para mostrar las páginas de manual o de ayuda de la herramienta rrd2csv, ejecute el siguiente comando:
man rrd2csv
<!--NeedCopy-->
O bien
rrd2csv --help
<!--NeedCopy-->
Nota:
Cuando se utilizan varias opciones, suminístrelas individualmente. Por ejemplo: para devolver tanto el UUID como la etiqueta de nombre asociada a una VM o un host, llama a rrd2csv como se muestra a continuación:
rrd2csv -u -n
El UUID devuelto es único y adecuado como clave principal; sin embargo, la etiqueta del nombre de una entidad puede no ser necesariamente única.
La página de manual (rrd2csv --help
) es el texto de ayuda definitivo de la herramienta.
Alertas
Puede configurar XenServer para que genere alertas en función de cualquiera de las métricas de host o máquina virtual disponibles. Además, XenServer proporciona alertas preconfiguradas que se activan cuando los hosts se someten a determinadas condiciones y estados. Puede ver estas alertas mediante XenCenter o la CLI xe.
Ver alertas con XenCenter
Puede ver diferentes tipos de alertas en XenCenter si hace clic en Notificaciones y, a continuación, en Alertas. La vista Alertas muestra varios tipos de alertas, incluidas alertas de rendimiento, alertas del sistema y alertas de actualización de software.
Alertas de rendimiento
Las alertas de rendimiento se pueden generar cuando uno de los siguientes valores supera un umbral especificado en un host administrado, VM o repositorio de almacenamiento (SR): uso de CPU, uso de red, uso de memoria, uso de memoria de dominio de control, rendimiento de almacenamiento o uso de disco de VM.
De forma predeterminada, el intervalo de repetición de alertas se establece en 60 minutos, se puede modificar si es necesario. Las alertas se muestran en la página Alertas en el área Notificaciones de XenCenter. También puede configurar XenCenter para que envíe un correo electrónico para las alertas de rendimiento especificadas junto con otras alertas graves del sistema.
Las alertas personalizadas que se configuran mediante la CLI xe también se muestran en la página Alertas de XenCenter.
Cada alerta tiene un nivel de prioridad/gravedad correspondiente. Puede modificar estos niveles y, si lo quiere, elegir recibir un correo electrónico cuando se active la alerta. La prioridad/gravedad de la alerta predeterminada se establece en 3
.
Prioridad | Nombre | Descripción | Alerta de correo electrónico predeterminada |
---|---|---|---|
1 | Grave | Actúe ahora o los datos podrían perderse o corromperse permanentemente. | Sí |
2 | Mayor | Actúe ahora o algunos servicios pueden fallar. | Sí |
3 | Advertencia | Actúe ahora o un servicio puede verse afectado. | Sí |
4 | Menor | Observe que algo acaba de mejorar. | No |
5 | Información | Información diaria (inicio, parada, reanudación de VM, etc.) | No |
? | Unknown | Error desconocido | No |
Configurar alertas de rendimiento
-
En el panel Recursos, seleccione el host, la VM o el SR relevantes y, a continuación, haga clic en la ficha General y, a continuación, en Propiedades.
-
Seleccione la ficha Alertas. En la siguiente tabla se resumen las alertas que están disponibles para los hosts, las máquinas virtuales o los SR:
Nombre de alerta Host VM SR Descripción Generar alertas de uso de la CPU X X Defina el uso de la CPU y el umbral de tiempo que activan la alerta. Generar alertas de uso de CPU en el dominio de control X Establezca el uso de CPU del dominio de control y el umbral de tiempo que desencadenan la alerta. Generar alertas de uso de memoria X Establezca el uso de memoria y el umbral de tiempo que activan la alerta. Genere alertas de uso de memoria en el dominio de control X Establezca el uso de la memoria del dominio de control y el umbral de tiempo que desencadenan la alerta. Generar alertas de memoria disponible en el dominio de control X Establezca la memoria disponible del dominio de control y el umbral de tiempo que desencadenan la alerta. Generar alertas de uso del disco X Establecer el uso del disco y el umbral de tiempo desencadenan la alerta. Generar alertas de rendimiento del almacenamiento X Establezca el rendimiento del almacenamiento y el umbral de tiempo que desencadenan la alerta. Nota: Los dispositivos de bloqueo físico (PBD) representan la interfaz entre un host XenServer específico y un SR conectado. Cuando la actividad total de rendimiento SR de lectura/escritura en un PBD supera el umbral especificado, se generan alertas en el host conectado al PBD. A diferencia de otras alertas de host de XenServer, esta alerta debe configurarse en el SR. Generar alertas de uso de la red X X Establezca el uso de la red y el umbral de tiempo que activan la alerta. Para cambiar el intervalo de repetición de alertas, introduzca el número de minutos en el cuadro Intervalo de repetición de alertas. Cuando se alcanza un umbral de alerta y se genera una alerta, no se genera otra alerta hasta después de que haya transcurrido el intervalo de repetición de alertas.
-
Haga clic en OK para guardar los cambios.
Para obtener detalles completos sobre cómo ver, filtrar y configurar la gravedad de las alertas de rendimiento, consulte Configuración de alertas de rendimiento en la documentación de XenCenter.
Alertas del sistema
En la siguiente tabla se muestran los eventos y condiciones del sistema que desencadenan una alerta para que se muestre en la página Alertas de XenCenter.
Nombre | Prioridad/gravedad | Descripción |
---|---|---|
license_expires_pronto | 2 | El contrato de licencia de XenServer vence pronto. |
ha-statefile_lost | 2 | Se perdió el contacto con el repositorio de almacenamiento de alta disponibilidad, actúe pronto. |
ha-heartbeat_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciarse a menos que se tomen medidas. |
ha_statefile_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciarse a menos que se tomen medidas. |
haxapi_healthcheck_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciarse a menos que se tomen medidas. |
ha_network_bonding_error | 3 | Pérdida potencial del servicio. Pérdida de red que envía latidos de alta disponibilidad. |
ha_pool_overcommited | 3 | Pérdida potencial del servicio. La alta disponibilidad no puede garantizar la protección de las VM configuradas. |
ha_poor_drop_en_plan_exists_for | 3 | La cobertura de alta disponibilidad ha disminuido, es más probable que falle y aún no hay pérdidas. |
ha_protected_vm_restart_failed | 2 | Pérdida de servicio. La alta disponibilidad no pudo reiniciar una VM protegida. |
ha_host_falló | 3 | La alta disponibilidad detectó un error en un host. |
ha_host_was_cercado | 4 | La alta disponibilidad reinició un host para protegerlo contra la corrupción de la VM. |
redo_log_healthy | 4 | El redo log de XAPI se ha recuperado de un error anterior. |
redo_log_broken | 3 | El redo log de XAPI ha detectado un error. |
ip_configured_pif_can_unplug | 3 | XAPI puede desconectar una NIC con configuración IP cuando se usa alta disponibilidad, lo que posiblemente provoque un error de alta disponibilidad. |
error de host_sync_data_error | 3 | No se pudieron sincronizar las estadísticas de rendimiento de XenServer. |
host_clock_skew_detected | 3 | El reloj del host no se sincroniza con otros hosts del grupo. |
host_clock_went_backwards | 1 | El reloj del host está dañado. |
pool_master_transition | 4 | Se ha especificado un nuevo host como coordinador del grupo. |
pbd_plug_failed_on_server_start | 3 | El host no se pudo conectar al almacenamiento en el momento del arranque. |
auth_external_init_failed | 2 | El host no pudo habilitar la autenticación de AD externa. |
auth_external_pool_non-homogeneous | 2 | Los hosts de un grupo tienen una configuración de autenticación de AD diferente. |
multipath_period_alert | 3 | Se ha producido un error o se ha recuperado una ruta a un SR. |
bond-status-changed | 3 | Un enlace de un enlace se ha desconectado o vuelto a conectar. |
Alertas de actualización de software
- XenCenter antiguo: XenServer espera una versión más reciente, pero aún se puede conectar a la versión actual
- XenCenter desactualizado: XenCenter es demasiado antiguo para conectarse a XenServer
- XenServer desactualizado: XenServer es una versión antigua a la que el XenCenter actual no se puede conectar
- Alerta de licencia caducada: la licencia de XenServer ha caducado
- Falta la alerta de IQN: XenServer usa almacenamiento iSCSI pero el IQN del host está vacío
- Alerta de IQN duplicados: XenServer usa almacenamiento iSCSI y hay IQN de host duplicados
Configurar alertas de rendimiento mediante la CLI xe
Nota:
Los desencadenantes de las alertas se comprueban en un intervalo mínimo de cinco minutos. Este intervalo evita colocar una carga excesiva en el sistema para verificar estas condiciones e informar de falsos positivos. Si se establece un intervalo de repetición de alertas inferior a cinco minutos, las alertas se seguirán generando en el intervalo mínimo de cinco minutos.
La perfmon
herramienta de supervisión del rendimiento se ejecuta una vez cada cinco minutos y solicita actualizaciones de XenServer, cuya media es superior a un minuto. Estos valores predeterminados se pueden cambiar en /etc/sysconfig/perfmon
.
La herramienta perfmon
lee actualizaciones cada cinco minutos de variables de rendimiento que se ejecutan en el mismo host. Estas variables se separan en un grupo relacionado con el propio host y un grupo para cada VM que se ejecuta en ese host. Para cada máquina virtual y host, perfmon
lee el parámetro other-config:perfmon
y utiliza esta cadena para determinar qué variables supervisar y en qué circunstancias generar un mensaje.
Por ejemplo, a continuación se muestra un ejemplo de configuración de una alerta de “uso de CPU” de VM mediante la escritura de una cadena XML en el parámetro other-config:perfmon
:
xe vm-param-set uuid=vm_uuid other-config:perfmon=\
'<config>
<variable>
<name value="cpu_usage"/>
<alarm_trigger_level value="0.5"/>
</variable>
</config>'
<!--NeedCopy-->
Nota:
Puede usar varios nodos variables.
Después de establecer la nueva configuración, use el siguiente comando para actualizar perfmon
para cada host:
xe host-call-plugin host=host_uuid plugin=perfmon fn=refresh
<!--NeedCopy-->
Si no se realiza esta actualización, se produce una demora antes de que la nueva configuración surta efecto, ya que, de forma predeterminada, perfmon
comprueba si hay nuevas configuraciones cada 30 minutos. Este valor predeterminado se puede cambiar en /etc/sysconfig/perfmon
.
Elementos de VM válidos
-
name
: el nombre de la variable (sin valor predeterminado). Si el valor del nombre escpu_usage
,network_usage
odisk_usage
, los parámetrosrrd_regex
yalarm_trigger_sense
no son obligatorios, ya que se utilizan los valores predeterminados para estos valores. -
alarm_priority
: La prioridad de las alertas generadas (por defecto3
). -
alarm_trigger_level
: El nivel de valor que desencadena una alerta (sin valor predeterminado). -
alarm_trigger_sense
: El valor eshigh
sialarm_trigger_level
es un valor máximo; de lo contrario, eslow
sialarm_trigger_level
es un valor mínimo (el valor predeterminado eshigh
). -
alarm_trigger_period
: El número de segundos que se pueden recibir valores (por encima o por debajo del umbral de alerta) antes de enviar una alerta (el valor predeterminado es60
). -
alarm_auto_inhibit_period
: el número de segundos en que se inhabilitará esta alerta después de que se envíe una alerta (el valor predeterminado es3600
). -
consolidation_fn
: Combina variables de rrd_updates en un valor. Paracpu-usage
el valor predeterminado esaverage
, parafs_usage
el valor predeterminado esget_percent_fs_usage
y para todos los demás essum
. -
rrd_regex
: hace coincidir los nombres de las variables dexe vm-data-sources-list uuid=vm_uuid
, para calcular los valores de rendimiento. Este parámetro tiene valores predeterminados para las variables nombradas:- cpu_usage
- memory_internal_free
- network_usage
- disk_usage
Si se especifica, los valores de todos los elementos devueltos por xe vm-data-source-list
cuyos nombres coinciden con la expresión regular especificada se consolidan mediante el método especificado como consolidation_fn
.
Elementos host válidos
-
name
: el nombre de la variable (sin valor predeterminado). -
alarm_priority
: La prioridad de las alertas generadas (por defecto3
). -
alarm_trigger_level
: El nivel de valor que desencadena una alerta (sin valor predeterminado). -
alarm_trigger_sense
: El valor eshigh
cuandoalarm_trigger_level
es un valor máximo; de lo contrario, eslow
sialarm_trigger_level
es un valor mínimo (el valor predeterminado eshigh
). -
alarm_trigger_period
: el número de segundos que se pueden recibir valores (por encima o por debajo del umbral de alerta) antes de que se envíe una alerta (predeterminado60
). -
alarm_auto_inhibit_period
: El número de segundos durante los que se inhabilita la alerta después de enviar una alerta. (valor predeterminado3600
). -
consolidation_fn
: Combina variables derrd_updates
en un solo valor (de forma predeterminadasum
- oaverage
). -
rrd_regex
: Expresión regular para hacer coincidir los nombres de las variables devueltas por el comandoxe vm-data-source-list uuid=vm_uuid
y utilizarla para calcular el valor estadístico. Este parámetro tiene valores predeterminados para las siguientes variables con nombre:- cpu_usage
- network_usage
- memory_free_kib
- sr_io_throughput_total_xxxxxxxx (donde
xxxxxxxx
son los primeros ocho caracteres del SR-UUID).
Rendimiento de SR: las alertas de rendimiento del almacenamiento se deben configurar en el SR en lugar de en el host. Por ejemplo:
xe sr-param-set uuid=sr_uuid other-config:perfmon=\
'<config>
<variable>
<name value="sr_io_throughput_total_per_host"/>
<alarm_trigger_level value="0.01"/>
</variable>
</config>'
<!--NeedCopy-->
Configuración de ejemplo genérica
El siguiente ejemplo muestra una configuración genérica:
<config>
<variable>
<name value="NAME_CHOSEN_BY_USER"/>
<alarm_trigger_level value="THRESHOLD_LEVEL_FOR_ALERT"/>
<alarm_trigger_period value="RAISE_ALERT_AFTER_THIS_MANY_SECONDS_OF_BAD_VALUES"/>
<alarm_priority value="PRIORITY_LEVEL"/>
<alarm_trigger_sense value="HIGH_OR_LOW"/>
<alarm_auto_inhibit_period value="MINIMUM_TIME_BETWEEN_ALERT_FROM_THIS_MONITOR"/>
<consolidation_fn value="FUNCTION_FOR_COMBINING_VALUES"/>
<rrd_regex value="REGULAR_EXPRESSION_TO_CHOOSE_DATASOURCE_METRIC"/>
</variable>
<variable>
...
</variable>
...
</config>
<!--NeedCopy-->
Configurar alertas por correo electrónico
Puede configurar XenServer para que envíe notificaciones por correo electrónico cuando los hosts de XenServer generen alertas. La utilidad mail-alarm de XenServer usa sSMTP para enviar estas notificaciones por correo electrónico. Puede habilitar las alertas de correo electrónico básicas mediante XenCenter o la interfaz de línea de comandos (CLI) xe. Para seguir configurando las alertas por correo electrónico, puede modificar el archivo mail-alarm.conf
de configuración.
Utilice un servidor SMTP que no requiera autenticación. Los correos electrónicos enviados a través de servidores SMTP que requieren autenticación no se pueden entregar.
Habilitar alertas por correo electrónico mediante XenCenter
-
En el panel
Resources
, haga clic con el botón secundario en una agrupación y seleccioneProperties
. -
En la ventana
Properties
, seleccioneEmail Options
. -
Seleccione la casilla
Send email alert notifications
. Introduzca su dirección de destino preferida para los correos electrónicos de notificación y los detalles del servidor SMTP. -
Elige el idioma que prefieras de la lista
Mail language
. El idioma predeterminado para los correos electrónicos de alertas de rendimiento es el inglés.
Habilitar alertas de correo electrónico mediante la CLI xe
Para configurar las alertas por correo electrónico, especifique su dirección de destino preferida para los correos electrónicos de notificación y el servidor SMTP:
xe pool-param-set uuid=pool_uuid other-config:mail-destination=joe.bloggs@example.com
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com:<port>
<!--NeedCopy-->
XenServer configura automáticamente la dirección del remitente como. noreply@<hostname>
Sin embargo, puede configurar la dirección del remitente de forma explícita:
xe pool-param-set uuid=pool_uuid other-config:mail-sender=serveralerts@example.com
<!--NeedCopy-->
Al activar las notificaciones por correo electrónico, recibirá una notificación por correo electrónico cuando se genere una alerta con una prioridad de 3 o más. Por lo tanto, el nivel de prioridad mínimo predeterminado es 3
. Puede cambiar este valor predeterminado con el siguiente comando:
xe pool-param-set uuid=pool_uuid other-config:mail-min-priority=level
<!--NeedCopy-->
Nota:
Algunos servidores SMTP solo reenvían correos con direcciones que usan FQDN. Si descubre que los correos electrónicos no se reenvían, puede que sea por este motivo. En ese caso, puede establecer el nombre de host del servidor en el FQDN para que esta dirección se use cuando se conecte a su servidor de correo.
Para configurar el idioma de los correos electrónicos de alertas de rendimiento:
xe pool-param-set uuid=pool_uuid other-config:mail-language=ja-JP
<!--NeedCopy-->
El idioma predeterminado para los correos electrónicos de alertas de rendimiento es el inglés.
Configuración adicional
Para seguir configurando la utilidad mail-alarm en XenServer, cree un /etc/mail-alarm.conf
archivo que contenga lo siguiente:
root=postmaster
authUser=<username>
authPass=<password>
mailhub=@MAILHUB@
<!--NeedCopy-->
/etc/mail-alarm.conf
es una plantilla proporcionada por el usuario para el archivo de configuración de sSMTP ssmtp.conf
y se utiliza para todas las alertas generadas por los hosts de XenServer. Se compone de claves donde key=@KEY@
y @KEY@
se sustituye por el valor correspondiente de ssmtp-key
en pool.other_config
. A continuación, estos valores se pasan a ssmtp, lo que le permite controlar aspectos de la configuración de sSMTP mediante valores de pool.other_config
. Observa cómo @KEY@
(mayúsculas) se corresponde con ssmtp-key
(minúsculas, con el prefijo ssmtp-
).
Por ejemplo, si configura el servidor SMTP:
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com
<!--NeedCopy-->
y, a continuación, agregue lo siguiente a su archivo /etc/mail-alarm.conf
:
mailhub=@MAILHUB@
<!--NeedCopy-->
mailhub=@MAILHUB@
se convierte en mailhub=smtp.example.com
.
Cada servidor SMTP puede diferir ligeramente en su configuración y puede requerir una configuración adicional. Para seguir configurando sSMTP, modifique su archivo de configuración ssmtp.conf
. Al almacenar las claves relevantes en el archivo mail-alarm.conf
, puede utilizar los valores de pool.other_config
para configurar sSMTP. El siguiente extracto de la página principal de ssmtp.conf
muestra la sintaxis correcta y las opciones disponibles:
NAME
ssmtp.conf – ssmtp configuration file
DESCRIPTION
ssmtp reads configuration data from /etc/ssmtp/ssmtp.conf The file con-
tains keyword-argument pairs, one per line. Lines starting with '#'
and empty lines are interpreted as comments.
The possible keywords and their meanings are as follows (both are case-
insensitive):
Root
The user that gets all mail for userids less than 1000. If blank,
address rewriting is disabled.
Mailhub
The host to send mail to, in the form host | IP_addr port :
<port>. The default port is 25.
RewriteDomain
The domain from which mail seems to come. For user authentication.
Hostname
The full qualified name of the host. If not specified, the host
is queried for its hostname.
FromLineOverride
Specifies whether the From header of an email, if any, may over-
ride the default domain. The default is "no".
UseTLS
Specifies whether ssmtp uses TLS to talk to the SMTP server.
The default is "no".
UseSTARTTLS
Specifies whether ssmtp does a EHLO/STARTTLS before starting TLS
negotiation. See RFC 2487.
TLSCert
The file name of an RSA certificate to use for TLS, if required.
AuthUser
The user name to use for SMTP AUTH. The default is blank, in
which case SMTP AUTH is not used.
AuthPass
The password to use for SMTP AUTH.
AuthMethod
The authorization method to use. If unset, plain text is used.
May also be set to "cram-md5".
<!--NeedCopy-->
Campos y etiquetas personalizados
XenCenter admite la creación de etiquetas y campos personalizados, lo que permite la organización y la búsqueda rápida de máquinas virtuales, almacenamiento, etc. Para obtener más información, consulte Supervisión del rendimiento del sistema.
Búsquedas personalizadas
XenCenter admite la creación de búsquedas personalizadas. Las búsquedas se pueden exportar e importar, y los resultados de una búsqueda se pueden mostrar en el panel de navegación. Para obtener más información, consulte Supervisión del rendimiento del sistema.
Determinar el rendimiento de adaptadores de bus físicos
Para los HBA FC, SAS e iSCSI, puede determinar el rendimiento de red de sus PBD mediante el siguiente procedimiento.
- Enumera los PBD en un host.
- Determine qué LUNs se redirigen a través de qué PBD.
- Para cada PBD y SR, enumere los VBD que hacen referencia a los VDI en el SR.
- Para todos los VBD activos que están conectados a las máquinas virtuales en el host, calcule el rendimiento combinado.
Para el almacenamiento iSCSI y NFS, consulte las estadísticas de su red para determinar si hay un cuello de botella de rendimiento en el arreglo de discos o si el PBD está saturado.
Supervisar los recursos del host y del dom0 con NRPE
Nota:
La función NRPE está disponible para los clientes de XenServer Premium o Trial Edition. Para obtener más información sobre las licencias de XenServer, consulte Licencias. Para actualizar o comprar una licencia de XenServer, visite el sitio web de XenServer.
Los usuarios con la función de administrador de grupos pueden usar cualquier herramienta de supervisión de terceros que sea compatible con Nagios Remote Plugin Executor (NRPE) para supervisar los recursos que consumen el host de XenServer y dom0, el dominio de control del host.
Puede usar los siguientes complementos de verificación para monitorear los recursos del host y dom0:
Métrica | Nombre del cheque NRPE | Descripción | Umbral de advertencia predeterminado | Umbral crítico predeterminado | Datos de rendimiento devueltos |
---|---|---|---|---|---|
Carga de la CPU del host | check_host_load | Obtiene y comprueba la carga actual por CPU física del host, donde la carga hace referencia a la cantidad de vCPU en estado de ejecución o ejecutables. | 3 | 4 | Carga actual del sistema de la CPU del host (calculada tomando la carga promedio de la CPU física del host). |
Uso de la CPU del host (%) | check_host_cpu | Obtiene y comprueba el promedio actual de uso general de CPU del host. | 80% | 90% | El porcentaje de CPU host que está libre actualmente y el porcentaje que está en uso. |
Uso de memoria del host (%) | check_host_memory | Obtiene y comprueba el uso actual de memoria del host. | 80% | 90% | El porcentaje de memoria del host que está libre actualmente y el porcentaje que está en uso. |
Uso de vGPU en el host (%) | check_vgpu | Obtiene y comprueba todo el uso actual de vGPU de Nvidia en ejecución por parte del host. | 80% | 90% | El porcentaje de vGPU en ejecución que actualmente es gratuito y el porcentaje que está en uso. |
Uso de memoria de vGPU del host (%) | check_vgpu_memory | Obtiene y comprueba todo el uso actual de memoria vGPU de Nvidia en ejecución (incluidas la memoria compartida y la memoria gráfica) del host. | 80% | 90% | El porcentaje de memoria de vGPU en ejecución (incluidas la memoria compartida y la memoria gráfica) que está libre actualmente y el porcentaje que está en uso. |
Carga de CPU Dom0 | check_load | Obtiene y comprueba el promedio de carga actual del sistema por CPU de dom0, donde la carga hace referencia a la cantidad de procesos en ejecución o en estado ejecutable. | 2.7,2.6,2.5 | 3.2,3.1,3 | Los datos de carga de la CPU del host se calculan tomando el promedio de los últimos 1, 5 y 15 minutos. |
Uso de CPU Dom0 (%) | check_cpu | Obtiene y comprueba el promedio actual de uso general de CPU de dom0. | 80% | 90% | El uso promedio general de CPU de dom0 como porcentaje. |
Uso de memoria Dom0 (%) | comprobar_memoria | Obtiene y comprueba el uso actual de memoria de dom0. | 80% | 90% | El porcentaje de memoria dom0 que está libre actualmente y el porcentaje que está en uso. |
Intercambio gratuito de Dom0 (%) | check_swap | Obtiene y comprueba el uso de intercambio actual de dom0. | 20% | 10% | El porcentaje de MB en dom0 que actualmente es gratuito. |
Espacio libre de la partición raíz Dom0 (%) | check_disk_root | Obtiene y comprueba el uso actual de la partición raíz de dom0. | 20% | 10% | El porcentaje de MB de la partición raíz dom0 que está libre actualmente. |
Espacio libre de la partición de registro Dom0 (%) | check_disk_log | Obtiene y comprueba el uso actual de la partición de registro de dom0. | 20% | 10% | El porcentaje de MB de la partición de registro dom0 que está libre actualmente. |
Estado de la pila de herramientas | check_xapi | Obtiene y comprueba el estado de la pila de herramientas de administración de XenServer (también denominada XAPI). | El tiempo de actividad de XAPI transcurrió en segundos. | ||
Estado de rutas múltiples | check_multipath | Obtiene y comprueba el estado de las rutas de almacenamiento. | El estado de las rutas de almacenamiento. OK indica que todas las rutas están activas, WARNING indica que algunas rutas han fallado pero más de una está activa, CRITICAL indica que solo hay una ruta activa o que todas las rutas han fallado, UNKNOWN indica que las rutas múltiples del host están deshabilitadas y que no se puede obtener el estado de las rutas. |
NRPE es un servicio local que se ejecuta en dom0 y escucha en el puerto TCP (predeterminado) 5666 las solicitudes de ejecución de comprobaciones de una herramienta de supervisión. Cuando llega una solicitud, NRPE la analiza, busca el comando de comprobación correspondiente, incluidos los detalles del parámetro, en el archivo de configuración y, a continuación, lo ejecuta. El resultado de la comprobación se envía a la herramienta de supervisión, que almacena los resultados de las comprobaciones anteriores y proporciona un gráfico que muestra los datos históricos de rendimiento.
Requisitos previos
Para poder utilizar NRPE para supervisar los recursos del host y del dom0, la herramienta de supervisión que utilice debe cumplir los siguientes requisitos previos:
- La herramienta de monitoreo debe ser compatible con la versión 4.1.0 del NRPE.
- Para permitir la comunicación entre el NRPE y la herramienta de monitoreo, la herramienta de monitoreo debe admitir TLS 1.2 con cifrados
ECDHE-RSA-AES256-GCM-SHA384
yECDHE-RSA-AES128-GCM-SHA256
, y la curva EC es.secp384r1
Limitaciones
- Puede configurar los ajustes de NRPE para todo un grupo o para un host independiente que no forme parte de un grupo. Actualmente, no puede configurar los ajustes de NRPE para un host individual de un grupo.
-
Si agrega un host a un grupo que ya tiene el NRPE habilitado y configurado en él, XenCenter no aplica automáticamente la configuración de NRPE del grupo al nuevo host. Debe volver a configurar los ajustes de NRPE en el grupo después de agregar el nuevo host o configurar el nuevo host con los mismos ajustes de NRPE antes de agregarlo al grupo.
Nota:
Al reconfigurar los ajustes de NRPE en un grupo después de agregar un nuevo host, asegúrese de que el host esté en funcionamiento.
- Si se quita un host de un grupo con el NRPE habilitado y configurado en él, XenCenter no modifica la configuración de NPRE del host o del grupo.
Configurar NRPE mediante la CLI xe
Puede configurar NRPE mediante la CLI xe o XenCenter. Para obtener más información sobre cómo configurar NRPE mediante XenCenter, consulte Supervisar los recursos de host ydom0 con NRPE.
Tras realizar cambios de configuración en NRPE, reinicie el servicio NRPE mediante:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->
Habilitar NRPE
El NRPE está deshabilitado de forma predeterminada en XenServer. Para habilitar NRPE en el dominio de control de un host (dom0), ejecute los siguientes comandos en la CLI xe:
-
Obtenga el UUID de host del host que desea supervisar:
xe host-list
-
Habilite NRPE en el host:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable
Si la operación se ejecuta correctamente, se genera este comando
Success
. Cuando XenServer se reinicia, NRPE se inicia automáticamente.
Para detener, iniciar, reiniciar o deshabilitar NRPE:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->
donde la operación es stop
start
, restart
, o disable
.
Monitorización de servidores
Se trata de una lista delimitada por comas de direcciones IP o nombres de host que pueden comunicarse con el daemon NRPE. También se admiten direcciones de red con máscara de bits (por ejemplo 192.168.1.0/24
).
Vea la lista actual de servidores de monitoreo:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->
Permita que la herramienta de monitoreo ejecute comprobaciones:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->
Consulte todos los ajustes de NRPE:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->
Configure varios ajustes de NRPE:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->
Registros
Registro de depuración
De forma predeterminada, el registro de depuración está deshabilitado.
Para comprobar si el registro de depuración está habilitado, ejecute el siguiente comando:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->
Si debug: 0
se devuelve, el registro de depuración está deshabilitado.
Para habilitar el registro de depuración:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->
Registro SSL
De forma predeterminada, el registro SSL está deshabilitado:
ssl_logging=0x00
<!--NeedCopy-->
Para comprobar si el registro SSL está habilitado, ejecute el siguiente comando:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->
Para habilitar el registro SSL:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->
Umbrales críticos y de advertencia
Para algunos de estos complementos de comprobación, puede establecer valores de umbral críticos y de advertencia de modo que, si el valor devuelto por un complemento de comprobación supera los valores de umbral, se genere una alerta. El umbral de advertencia indica un problema potencial y el umbral crítico indica un problema más grave que requiere atención inmediata. Aunque los valores predeterminados están establecidos para los umbrales críticos y de advertencia, puede ajustar los valores de los umbrales.
Para consultar los valores predeterminados de advertencia y umbral crítico para todas las comprobaciones, ejecute el siguiente comando xe de la CLI, que devuelve una lista de todas las comprobaciones y sus umbrales críticos y de advertencia asociados:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->
También puede consultar los valores de umbral para una comprobación específica. Por ejemplo, para obtener los valores de advertencia y de umbral crítico del complemento check_memory
check, ejecute el siguiente comando xe de la CLI:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->
También puede cambiar el valor predeterminado de un umbral. Por ejemplo, para cambiar los valores de umbral predeterminados del complemento check_memory
check, ejecute el siguiente comando xe de la CLI:
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->
Supervisar los recursos de host y dom0 con SNMP
Nota:
La función SNMP está disponible para los clientes de XenServer Premium o Trial Edition. Para obtener más información sobre las licencias de XenServer, consulte Licencias. Para actualizar o comprar una licencia de XenServer, visite el sitio web de XenServer.
Con la función de administrador del grupo, puede usar SNMP para supervisar de forma remota los recursos consumidos por el host de XenServer y dom0, el dominio de control del host. Un administrador SNMP, también conocido como sistema de administración de redes (NMS), envía solicitudes de consulta a un agente SNMP que se ejecuta en un host de XenServer. El agente SNMP responde a estas solicitudes de consulta enviando los datos recopilados en varias métricas al NMS. Los datos que se pueden recopilar se definen mediante identificadores de objetos (OID) en un archivo de texto denominado base de datos de información de administración (MIB). Un OID representa una información medible específica sobre un dispositivo de red, como el uso de la CPU o la memoria.
También puede configurar capturas, que son mensajes iniciados por el agente que alertan al NMS de que se ha producido un evento específico en XenServer. Tanto las solicitudes de consulta como las capturas se pueden usar para supervisar el estado de los grupos de XenServer. Se definen como objetos de métrica y de captura y se identifican mediante los OID en un archivo MIB XENSERVER-MIB.txt
, que se puede descargar desde la página de descargas de XenServer. En las tablas siguientes se proporciona información sobre estos objetos de métrica y de captura.
Objetos de métrica
Puede solicitar información específica sobre los hosts de XenServer mediante las métricas que se muestran en la tabla siguiente. El administrador de SNMP utiliza estas métricas al enviar solicitudes de consulta a un agente de SNMP y, por lo tanto, puede ver estos datos en su NMS.
Puede ver los datos devueltos por estos objetos de métrica desde su NMS o desde la CLI xe. Para consultar los objetos de métrica desde la CLI xe, ejecute host-data-source-query
o vm-data-source-query
proporcione la fuente de datos RRDD como valor para el parámetro data-source
. Por ejemplo:
xe host-data-source-query data-source=cpu_avg host=<host UUID>
<!--NeedCopy-->
Nota:
De forma predeterminada, el NMS envía solicitudes de consulta de OID a los agentes SNMP a través del puerto 161.
Identificador de objeto (OID) | Fuente de datos RRDD | Datos devueltos | Tipo |
---|---|---|---|
.1.3.6.1.4.1.60953.1.1.1.1 | memory |
Memoria total de Dom0 en MB | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.2 | memory_internal_free |
Memoria libre de Dom0 en MB | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.3 | cpu_usage |
Uso de CPU de Dom0 como porcentaje | Flotante |
.1.3.6.1.4.1.60953.1.1.1.4 | memory_total_kib |
Memoria total del host en MB | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.5 | memory_free_kib |
Memoria libre del host en MB | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.6 | cpu_avg |
Uso de la CPU del host como porcentaje | Flotante |
.1.3.6.1.4.1.60953.1.1.1.7 | (véase la nota 1) | Número de pCPU | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.8 | running_vcpus |
Número de vCPU en ejecución | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.9 | running_domains |
Número de máquinas virtuales en ejecución | Unsigned32 |
Notas:
El nombre de una pCPU tiene el formato
cpu
seguido de un número. Para consultar la cantidad de pCPU desde la CLI xe, ejecute el siguiente comando:
xe host-data-source-list host=<host UUID> | grep -E 'cpu[0-9]+$'
This returns a list of the CPU metrics that match the regular expression
cpu[0-9]+
.
Capturas
Las capturas son alertas que envía el agente SNMP para notificar al administrador de SNMP cuando se producen ciertos eventos, lo que le permite supervisar los hosts de XenServer e identificar los problemas con antelación. Puede configurar los ajustes de SNMP para generar una captura cuando se alcance un límite (por ejemplo, si el uso de la CPU del host es demasiado alto). Cuando se genera una captura, se envía a su NMS y se devuelven los siguientes campos como parte del objeto de captura.
Nota:
De forma predeterminada, el agente SNMP del host del coordinador del grupo envía capturas al NMS a través del puerto UPD 162.
Identificador de objeto (OID) | Nombre del campo | Tipo | Descripción |
---|---|---|---|
.1.3.6.1.4.1.60953.1.10.1.1 | operation |
Cadena | Puede ser uno de los valores siguientes: add o del . operation es add si XenServer genera una captura y la envía a su NMS (también se crea una alerta en XenCenter) o del si se destruye una alerta (por ejemplo, si se descarta una alerta). |
.1.3.6.1.4.1.60953.1.10.1.2 | ref |
Cadena | La referencia del objeto de captura. |
.1.3.6.1.4.1.60953.1.10.1.3 | uuid |
Cadena | El UUID del objeto de captura. |
.1.3.6.1.4.1.60953.1.10.1.4 | name |
Cadena | El nombre del objeto de captura. |
.1.3.6.1.4.1.60953.1.10.1.5 | priority |
Número entero | La gravedad de la captura. Puede ser uno de los valores siguientes 1 : Crítica, 2 : Grave, 3 : Advertencia, 4 : Leve, 5 : Información, others : Desconocida. |
.1.3.6.1.4.1.60953.1.10.1.6 | class |
Cadena | La categoría de la captura generada. Puede ser uno de los valores siguientes: VM Host , SR , Pool , VMPP , VMSS , PVS_proxy , VDI o Certificate . |
.1.3.6.1.4.1.60953.1.10.1.7 | obj-uuid |
Cadena | El UUID del objeto xapi de las distintas clases del campo class . |
.1.3.6.1.4.1.60953.1.10.1.8 | timestamp |
Cadena | Hora en la que se genera la captura. |
.1.3.6.1.4.1.60953.1.10.1.9 | body |
Cadena | Información detallada sobre el campo name . |
Requisitos previos
-
Todos los hosts de un grupo deben ejecutar la misma versión de XenServer y esta versión debe contener el plug-in de SNMP.
Nota:
Si no puede ver la ficha SNMP en XenCenter, es posible que el host o un miembro del grupo no ejecute una versión de XenServer que admita SNMP. Actualice el host o el grupo a la versión más reciente de XenServer.
-
El NMS que use debe ser compatible con SNMPv2c o SNMPv3.
-
Su NMS y XenServer deben estar conectados a la red.
Limitaciones
- Puede configurar los parámetros de SNMP para un grupo completo o para un host independiente que no forme parte de un grupo. Actualmente, no puede configurar los parámetros de SNMP para un host individual de un grupo.
-
Si agrega un host a un grupo que ya tiene SNMP habilitado y configurado, XenCenter no aplica automáticamente los parámetros de SNMP del grupo al nuevo host. Debe reconfigurar los parámetros de SNMP en el grupo después de agregar el nuevo host o configurar el nuevo host con los mismos parámetros de SNMP antes de agregarlo al grupo.
Nota:
Al reconfigurar los parámetros de SNMP en un grupo después de agregar un nuevo host, asegúrese de que el host esté en funcionamiento y no en modo de mantenimiento.
-
Antes de realizar una actualización sucesiva de grupos de Citrix Hypervisor 8.2 CU1 a XenServer 8 o de aplicar actualizaciones a los hosts y grupos de XenServer, haga una copia de seguridad de los siguientes archivos de configuración si los ha modificado manualmente antes y los necesita:
/etc/snmp/snmpd.xs.conf
/etc/sysconfig/snmp
/var/lib/net-snmp/snmpd.conf
- Cuando el agente SNMP está desconectado, no se pueden generar capturas. Por ejemplo, si se reinicia el agente SNMP o si el coordinador del grupo se reinicia o se vuelve a designar.
Configurar SNMP mediante la CLI xe
Puede configurar SNMP mediante la CLI xe o XenCenter. Para obtener más información sobre cómo configurar SNMP mediante XenCenter, consulte Supervisión de los recursos de host y dom0 con SNMP.
Objetos result
Al configurar SNMP, todas las respuestas se devuelven en formato JSON. Si un comando se ejecuta correctamente, devuelve el par clave-valor "code": 0
. Algunos comandos (como el comando get-config
) devuelven un objeto JSON anidado llamado result
. El objeto JSON result
también es necesario para el comando set-config
que se usa para actualizar la configuración de SNMP.
El objeto JSON result
se compone de los siguientes objetos common
, agent
y nmss
:
common
Campo | Valores permitidos | Valor predeterminado |
---|---|---|
enabled |
no (inhabilitar el servicio SNMP) o yes (habilitar el servicio SNMP) |
no |
debug_log |
no (inhabilitar el registro de depuración) o yes (habilitar el registro de depuración) |
no |
max_nmss |
N/A (este campo es de solo lectura y especifica la cantidad máxima de NMS compatibles) | 1 |
agent
Campo | Valores permitidos | Valor predeterminado |
---|---|---|
v2c |
no (inhabilitar SNMPv2c) o yes (habilitar SNMPv2c) |
yes |
community |
COMMON_STRING_TYPE (ver nota 1) | public |
v3 |
no (inhabilitar v3) o yes (habilitar v3) |
no |
user_name |
COMMON_STRING_TYPE (ver nota 1) | |
authentication_password |
COMMON_STRING_TYPE donde la longitud es >= 8 (ver nota 1) | |
authentication_protocol |
MD5 o SHA
|
|
privacy_password |
COMMON_STRING_TYPE donde la longitud es >= 8 (ver nota 1) | |
privacy_protocol |
DES o AES
|
|
engine_id |
N/A (este campo es de solo lectura y se genera cuando el agente SNMP se inicia por primera vez) |
nmss
Campo | Valores permitidos | Valor predeterminado |
---|---|---|
uuid |
UUID de NMS (se establece al configurar el receptor de capturas de NMS y este valor debe ser uniforme en todos los hosts de un grupo) | |
address |
Dirección IPv4 o nombre de host (FQDN) de NMS | |
port |
1 a 65535
|
162 |
v2c |
no (inhabilitar SNMPv2c), yes (habilitar SNMPv2c) o admite SNMPv2c o v3. |
yes |
community |
COMMON_STRING_TYPE (ver nota 1) | public |
v3 |
no (inhabilitar la versión 3), yes (habilitar la versión 3) o admite SNMPv2c o SNMPv3. |
no |
user_name |
COMMON_STRING_TYPE (ver nota 1) | |
authentication_password |
COMMON_STRING_TYPE donde la longitud es >= 8 (ver nota 1) | |
authentication_protocol |
MD5 o SHA
|
|
privacy_password |
COMMON_STRING_TYPE donde la longitud es >= 8 (ver nota 1) | |
privacy_protocol |
DES o AES
|
Notas:
- COMMON_STRING_TYPE hace referencia a una cadena que cumple los siguientes requisitos:
- Cualquier combinación de letras, números, guiones (-), punto (.), libra (#), arroba (@), igual a (=), dos puntos (:) o caracteres de subrayado (_).
- Longitud entre 6 y 32, ambos incluidos.
- Las contraseñas no se almacenan en texto simple en ningún archivo de configuración de XenServer. Se convierten en una clave localizada y se almacenan. El comando
get-config
muestra la contraseña como una constante oculta compuesta de asteriscos (*).
Configurar el servicio SNMP
Obtenga el estado del servicio SNMP:
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=status
<!--NeedCopy-->
Inicie, detenga o reinicie el servicio SNMP:
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=<operation>
<!--NeedCopy-->
donde la operaciónes start
, stop
o restart
.
Obtenga los detalles de configuración de SNMP:
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=get-config
<!--NeedCopy-->
Si se ejecuta correctamente, este comando devuelve el par clave-valor "code": 0
y el objeto JSON result
que contiene los detalles de configuración del servicio SNMP. Por ejemplo:
"code": 0,
"result": {
"common": {
"enabled": "no",
"debug_log": "no",
"max_nmss": 1
},
"agent": {
"v2c": "yes",
"v3": "no",
"community": "public",
"user_name": "",
"authentication_password": "",
"authentication_protocol": "",
"privacy_password": "",
"privacy_protocol": "",
"engine_id": "<engine_id>"
},
"nmss": []
}
<!--NeedCopy-->
Copie el objeto JSON result
en su editor de textos preferido y elimine todos los caracteres de nueva línea (\n) del archivo. Actualice los campos con los detalles de configuración de SNMP. Para configurar el NMS, consulte la documentación de NMS y especifique los valores de los campos necesarios para el objeto nmss
. Para obtener más información, consulte los objetos enumerados anteriormente.
Para configurar el servicio SNMP, ejecute el comando set-config
y proporcione el objeto JSON result
modificado como un valor de parámetro para el parámetro args:config
.
Defina la configuración de SNMP:
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=set-config args:config='<result>'
<!--NeedCopy-->
donde el resultado es el objeto JSON result
devuelto por el comando get-config
que copió y modificó.
Nota:
Para configurar SNMP para todo un grupo, debe ejecutar el comando
set-config
para cada host del grupo.
Si los cambios de configuración se realizan correctamente, el comando devuelve el par clave-valor "code": 0
. Si los cambios de configuración no se realizan correctamente, el comando set-config
devuelve uno de los siguientes pares clave-valor que indican que se ha producido un error:
-
"code": 1
: Cadena de error común. Por ejemplo, una excepción desconocida. -
"code": 2
: Cadena de error (falta un parámetro). -
"code": 3
: Devuelve un objetomessage
en forma de lista donde cada elemento tiene el formato de[field_path, key, value, error string]
.
También puede enviar una captura SNMP de prueba a su NMS para verificar que la información del receptor de capturas especificada es correcta.
Enviar una captura SNMP de prueba:
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=send-test-trap args:config='{"nmss":[{"uuid":"<uuid>","address":"<address>","port":162,"v2c":"yes","v3":"no","community":"public","user_name":"<user_name>","authentication_password":"<authentication_password>","authentication_protocol":"<authentication_protocol>","privacy_password":"<privacy_password>","privacy_protocol":"<privacy_protocol>"}]}'
<!--NeedCopy-->
Este comando envía una captura de prueba a su NMS con los comandos msg_name
de TEST_TRAP
y msg_body
de This is a test trap from XenServer pool "<pool name>" to verify the NMS Trap Receiver configuration.
Si no recibe la captura de prueba, vuelva a comprobar la configuración de SNMP. Si no funciona, el comando send-test-trap
también devuelve uno de los siguientes pares clave-valor que indican que se ha producido un error:
-
"code": 1
: Cadena de error común. Por ejemplo, una excepción desconocida. -
"code": 2
: Cadena de error (falta un parámetro). -
"code": 3
: Devuelve un objetomessage
en forma de lista donde cada elemento tiene el formato de[field_path, key, value, error string]
. -
"code": 4
: Devuelve un objetomessage
en forma de lista donde cada elemento tiene el formato de[nms address, nms port, error string]
.
En este artículo
- Supervise el rendimiento de XenServer
- Usar RRD
- Alertas
- Configurar alertas por correo electrónico
- Campos y etiquetas personalizados
- Búsquedas personalizadas
- Determinar el rendimiento de adaptadores de bus físicos
- Supervisar los recursos del host y del dom0 con NRPE
- Supervisar los recursos de host y dom0 con SNMP