Supervisar y administrar la implementación
proporciona supervisión detallada de las métricas de rendimiento, incluidas la CPU, la memoria, el disco, la red, la información de estado C/P y el almacenamiento. Cuando proceda, estas métricas están disponibles por host y por VM. Estas métricas están disponibles directamente o pueden accederse y visualizarse gráficamente en u otras aplicaciones de terceros.
también proporciona alertas de sistema y rendimiento. Las alertas son notificaciones que se producen en respuesta a eventos del sistema seleccionados. Estas notificaciones también se producen cuando uno de los siguientes valores supera un umbral especificado en un host administrado, VM o repositorio de almacenamiento: uso de CPU, uso de red, uso de memoria, uso de memoria de dominio de control, rendimiento de almacenamiento o uso de disco de VM. Puede configurar las alertas mediante la CLI de xe o mediante . Para crear notificaciones basadas en cualquiera de las métricas de rendimiento de host o VM disponibles, consulte Alertas de rendimiento.
Supervisar el rendimiento
Los clientes pueden supervisar el rendimiento de sus hosts y máquinas virtuales (VM) utilizando las métricas expuestas a través de las bases de datos Round Robin (RRD). Estas métricas se pueden consultar a través de HTTP o a través de la herramienta RRD2CSV. Además, utiliza estos datos para producir gráficos de rendimiento del sistema. Para obtener más información, consulte Analizar y visualizar métricas.
En las tablas siguientes se enumeran todas las métricas de Host y VM disponibles.
Notas:
- La latencia durante un período se define como la latencia media de las operaciones durante ese período.
- La disponibilidad y utilidad de ciertas métricas dependen de SR y CPU.
- Las métricas de rendimiento no están disponibles para los SRs y discos de GFS2 en esos SRs.
Métricas de host disponibles
| Nombre de métrica | Descripción | Condición | Nombre |
|---|---|---|---|
avgqu_sz_<sr-uuid-short> |
Tamaño medio de la cola de E/S (solicitudes). | Al menos un VBD conectado en SR<sr-uuid-short> en el host |
Tamañosr-uuid-short de cola |
cpu<cpu>-C<cstate> |
Tiempo de CPU encpu estado Ccstate en milisegundos. |
C state existe en la CPU |
cpu Estado Ccstate de la CPU |
cpu<cpu>-P<pstate> |
Tiempo de CPU encpu estado Ppstate en milisegundos. |
El estado P existe en la CPU |
cpu Estado Ppstate de la CPU |
cpu<cpu> |
Utilización de CPU físicacpu (fracción). Habilitado de forma predeterminada. |
La CPUcpu existe |
CPUcpu
|
cpu_avg |
Utilización media de CPU físicas (fracción). Habilitado de forma predeterminada. | Ninguno | CPU promedio |
inflight_<sr-uuid-short> |
Número de solicitudes de E/S actualmente en vuelo. Habilitado de forma predeterminada. | Al menos un VBD conectado en SRsr en el host |
Solicitudes asr bordo |
io_throughput_read_<sr-uuidshort> |
Datos leídos de SR (MIB/s). | Al menos un VBD conectado en SRsr en el host |
Rendimiento desr lectura |
io_throughput_write_<sr-uuidshort> |
Datos escritos en el SR (MIB/s). | Al menos un VBD conectado en SRsr en el host |
Rendimiento desr escritura |
io_throughput_total_<sr-uuidshort> |
Todas las E/S SR (MIB/s). | Al menos un VBD conectado en SRsr en el host |
Rendimientosr total |
iops_read_<sr-uuid-short> |
Solicitudes de lectura por segundo. | Al menos un VBD conectado en SRsr en el host |
sr Leer IOPS |
iops_write_<sr-uuid-short> |
Escribir solicitudes por segundo. | Al menos un VBD conectado en SRsr en el host |
sr Escribir IOPS |
iops_total_<sr-uuid-short> |
Solicitudes de E/S por segundo. | Al menos un VBD conectado en SRsr en el host |
sr Total de IOPS |
iowait_<sr-uuid-short> |
Porcentaje del tiempo de espera de E/S. | Al menos un VBD conectado en SRsr en el host |
Espera desr E/S |
latency_<sr-uuid-short> |
Latencia media de E/S (milisegundos). | Al menos un VBD conectado en SRsr en el host |
sr Latencia |
loadavg |
Promedio de carga de Domain0. Habilitado de forma predeterminada | Ninguno | Carga de dominio de control |
memory_free_kib |
Cantidad total de memoria libre (KB). Habilitado de forma predeterminada. | Ninguno | Memoria libre |
memory_reclaimed |
Memoria del host recuperada por squeeze (B). | Ninguno | Memoria recuperada |
memory_reclaimed_max |
Memoria de host disponible para recuperar con squeeze (B). | Ninguno | Memoria recuperada potencial |
memory_total_kib |
Cantidad total de memoria (KB) en el host. Habilitado de forma predeterminada. | Ninguno | Memoria total |
network/latency |
Intervalo en segundos entre los dos últimos latidos transmitidos desde el host local a todos los hosts en línea. Deshabilitado de forma predeterminada. | HA habilitado | Latencia de red |
statefile/<t>/latency |
Tiempo de entrega en segundos del último acceso al archivo de estado desde el host local. Deshabilitado de forma predeterminada. | HA habilitado | Latencia de archivos de estado de HA |
pif_<pif>_rx |
Bytes por segundo recibidos en la interfaz físicapif. Habilitado de forma predeterminada. |
PIF existe |
-pifname Recibir (ver nota) |
pif_<pif>_tx |
Bytes por segundo enviados en la interfaz físicapif. Habilitado de forma predeterminada. |
PIF existe |
-pifname Enviar (ver nota) |
pif_<pif>_rx_errors |
Recibir errores por segundo en la interfaz físicapif. Deshabilitado de forma predeterminada. |
PIF existe | Errores de-pifname recepción (consulte la nota) |
pif_<pif>_tx_errors |
Transmitir errores por segundo en la interfaz físicapif . Deshabilitado de forma predeterminada |
PIF existe | Errores de-pifname envío (consulte la nota) |
pif_aggr_rx |
Bytes por segundo recibidos en todas las interfaces físicas. Habilitado de forma predeterminada. | Ninguno | Total de recepción de NIC |
pif_aggr_tx |
Bytes por segundo enviados em todas as interfaces físicas. Habilitado de forma predeterminada. | Ninguno | Total de envío de NIC |
pvsaccelerator_evicted |
Bytes por segundo desalojados de la caché | PVSACcelerator Activado | Tasa de desalojo del acelerador PVS |
pvsaccelerator_read_hits |
Lecturas por segundo servidas desde la caché | PVSACcelerator Activado | Tasa de aciertos del acelerador PVS |
pvsaccelerator_read_misses |
Lecturas por segundo que no se pueden servir desde la caché | PVSACcelerator Activado | Tasa de pérdida del acelerador PVS |
pvsaccelerator_traffic_client_sent |
Bytes por segundo enviados por clientes PVS almacenados en caché | PVSACcelerator Activado | El acelerador de PVS observó tráfico de red de los clientes |
pvsaccelerator_traffic_server_sent |
Bytes por segundo enviados por servidores PVS almacenados en caché | PVSACcelerator Activado | El acelerador de PVS observó tráfico de red desde servidores |
pvsaccelerator_read_total |
Lecturas por segundo observadas por la caché | PVSACcelerator Activado | Velocidad de lectura observada del acelerador PVS |
pvsaccelerator_traffic_proxy_saved |
Bytes por segundo enviados por PVSACcelerator en lugar del servidor PVS | PVSACcelerator Activado | Tráfico de red guardado del acelerador PVS |
pvsaccelerator_space_utilization |
Porcentaje de espacio utilizado por PVSACcelerator en este host, en comparación con el tamaño total del almacenamiento en caché | PVSACcelerator Activado | Utilización del espacio del acelerador PVS |
sr_<sr>_cache_size |
Tamaño en bytes de IntelliCache SR. Habilitado de forma predeterminada. | IntelliCache habilitado | Tamaño de caché de IntelliCache |
sr_<sr>_cache_hits |
Acertos de caché por segundo. Habilitado de forma predeterminada. | IntelliCache habilitado | Accesos a la caché de IntelliCache |
sr_<sr>_cache_misses |
Fallos de caché por segundo. Habilitado de forma predeterminada. | IntelliCache habilitado | Caché IntelliCache falla |
xapi_allocation_kib |
Asignación de memoria (KiB) realizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Asignación de memoria del agente |
xapi_free_memory_kib |
Memoria libre (KiB) disponible para el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Memoria del agente libre |
xapi_healthcheck/latency_health |
Tiempo de entrega en segundos de la última llamada de supervisión de estado XAPI en el host local. Deshabilitado de forma predeterminada | Alta disponibilidad habilitada | Latencia de comprobación de estado |
xapi_live_memory_kib |
Memoria en vivo (KiB) utilizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Memoria del agente en vivo |
xapi_memory_usage_kib |
Memoria total (KiB) asignada utilizada por el demonio XAPI. Habilitado de forma predeterminada. | Ninguno | Uso de memoria del agente |
Métricas de VM disponibles
| Nombre de métrica | Descripción | Condición | Nombre |
|---|---|---|---|
cpu<cpu> |
Utilización de vCPUcpu (fracción). Habilitado de forma predeterminada |
La vCPUcpu existe |
CPU |
memory |
Memoria asignada actualmente a VM (Bytes) .Habilitada de forma predeterminada | Ninguno | Memoria total |
memory_target |
Destino del controlador de globo de VM (Bytes). Habilitado de forma predeterminada | Ninguno | Destino de memoria |
memory_internal_free |
Memoria utilizada según lo informado por el agente invitado (KiB). Habilitado de forma predeterminada | Ninguno | Memoria libre |
runstate_fullrun |
Fracción de tiempo que se están ejecutando todas las VCPU. | Ninguno | Ejecución completa de las vCPU |
runstate_full_contention |
Fracción de tiempo que todas las VCPU son ejecutables (es decir, esperando CPU) | Ninguno | Contención completa de vCPU |
runstate_concurrency_hazard |
Fracción de tiempo que algunas VCPU se están ejecutando y otras se pueden ejecutar | Ninguno | Peligro de concurrencia de VCPUs |
runstate_blocked |
Fracción de tiempo que todas las VCPU están bloqueadas o sin conexión | Ninguno | VCPU inactivas |
runstate_partial_run |
Fracción de tiempo que algunas VCPU se están ejecutando y algunas están bloqueadas | Ninguno | Ejecución parcial de vCPU |
runstate_partial_contention |
Fracción de tiempo que algunas VCPU se pueden ejecutar y otras están bloqueadas | Ninguno | Contención parcial de vCPU |
vbd_<vbd>_write |
Escribe en el dispositivovbd en bytes por segundo. Habilitado de forma predeterminada |
VBDvbd existe |
vbd Escritura en disco |
vbd_<vbd>_read |
Lee desde el dispositivovbd en bytes por segundo. Habilitado de forma predeterminada. |
VBDvbd existe |
vbd Lectura de disco |
vbd_<vbd>_write_latency |
Escribe en el dispositivovbd en microsegundos. |
VBDvbd existe |
Latencia devbd escritura en disco |
vbd_<vbd>_read_latency |
Lee desde el dispositivovbd en microsegundos. |
VBDvbd existe |
Latencia devbd lectura de disco |
vbd <vbd>_iops_read |
Solicitudes de lectura por segundo. | Al menos un VBD conectado para VDI no ISO en el host | IOPS devbd lectura de disco |
vbd <vbd>_iops_write |
Escribir solicitudes por segundo. | Al menos un VBD conectado para VDI no ISO en el host | IOPS devbd escritura en disco |
vbd <vbd>_iops_total |
Solicitudes de E/S por segundo. | Al menos un VBD conectado para VDI no ISO en el host | vbd`` Total de IOPS de disco |
vbd <vbd>_iowait |
Porcentaje de tiempo de espera I/0. | Al menos un VBD conectado para VDI no ISO en el host | Espera devbd E/S de disco |
vbd <vbd>_inflight |
Número de solicitudes de E/S actualmente en vuelo. | Al menos un VBD conectado para VDI no ISO en el host | Solicitudesvbd de disco en curso |
vbd <vbd>_avgqu_sz |
Tamaño medio de la cola de E/S. | Al menos un VBD conectado para VDI no ISO en el host | Tamaño devbd cola de disco |
vif_<vif>_rx |
Bytes por segundo recibidos en el número de interfaz virtualvif. Habilitado de forma predeterminada. |
VIFvif existe |
vif Reciba |
vif_<vif>_tx |
Bytes por segundo transmitidos en la interfaz virtualvif. Habilitado de forma predeterminada. |
VIFvif existe |
vif Enviar |
vif_<vif>_rx_errors |
Recibir errores por segundo en la interfaz virtualvif. Habilitado de forma predeterminada. |
VIFvif existe |
vifEr@@ rores de recepción |
vif_<vif>_tx_errors |
Transmitir errores por segundo en la interfaz virtualvif Habilitado de forma predeterminada. |
VIFvif existe |
vif Enviar errores |
Nota:
El valor de
<-pif-name>puede ser cualquiera de los siguientes:
NIC If contains pif_eth#, where ## is 0–9 If contains pif_eth#.## or pif_xenbr## or pif_bond## Network If contains pif_xapi##, (note that appears as is) TAP If contains pif_tap## xapi Loopback If contains pif_lo
Analizar y visualizar métricas
La ficha Rendimiento de proporciona supervisión en tiempo real de las estadísticas de rendimiento entre los grupos de recursos, además de tendencias gráficas del rendimiento de las máquinas virtuales y físicas. Los gráficos que muestran CPU, memoria, red y E/S de disco se incluyen en la ficha Rendimiento de forma predeterminada. Puede agregar más métricas, cambiar el aspecto de los gráficos existentes o crear otras adicionales. Para obtener más información, consulte Configuración de métricas en la siguiente sección.
-
Puede ver hasta 12 meses de datos de rendimiento y ampliar el zoom para ver más de cerca los picos de actividad.
-
puede generar alertas de rendimiento cuando el uso de CPU, memoria, E/S de red, E/S de almacenamiento o E/S de disco supera un umbral especificado en un servidor, VM o SR. Para obtener más información, consulte Alertas en la siguiente sección.
Nota:
Instale los (controladores paravirtualizados) para ver los datos completos de rendimiento de VM.
Configurar gráficos de rendimiento
Para agregar un gráfico:
-
En la ficha Rendimiento , haga clic en Acciones y, a continuación, Nuevo gráfico . Aparece el cuadro de diálogo Nuevo gráfico.
-
En el campo Nombre , escriba un nombre para el gráfico.
-
En la lista de fuentes de datos, active las casillas de verificación de los orígenes de datos que desee incluir en el gráfico.
-
Haga clic en Guardar.
Para editar un gráfico existente:
-
Acceda a la ficha Rendimiento y seleccione el gráfico que desea modificar.
-
Haga clic con el botón derecho en el gráfico y seleccione Acciones, o haga clic en el botón Acciones. A continuación, seleccione Editar gráfico.
-
En la ventana de detalles del gráfico, realice los cambios necesarios y haga clic en Aceptar.
Configurar el tipo de gráfico
Los datos de los gráficos de rendimiento se pueden mostrar como líneas o como áreas. Para cambiar el tipo de gráfico:
-
En el menú Herramientas , haga clic en Opciones y seleccione Gráficos .
-
Para ver los datos de rendimiento como un gráfico de líneas, haga clic en la opción Gráfico de líneas .
-
Para ver los datos de rendimiento como un gráfico de área, haga clic en la opción Gráfico de área .
-
Haga clic en Aceptar para guardar los cambios.
Encontrará información detallada sobre la configuración y visualización de gráficos de rendimiento en la Ayuda de la sección Supervisión del rendimiento del sistema.
Configurar métricas
Nota:
Los estados C y los estados P son características de administración de energía de algunos procesadores. El rango de estados disponibles depende de las capacidades físicas del host, así como de la configuración de administración de energía.
Los comandos host y VM devuelven lo siguiente:
-
Una descripción completa de la fuente de datos
-
Las unidades aplicadas a la métrica
-
El rango de valores posibles que se pueden utilizar
Por ejemplo:
label_nombre: CPU0-C1
name_description: Proporción de tiempo CPU 0 gastado en C-state 1
habilitado: true
estándar: true
mín: 0.000
máx: 1.000
unidades: Porcentaje
Habilitar una métrica específica
La mayoría de las métricas están habilitadas y recopiladas de forma predeterminada. Para habilitar las métricas que no lo son, escriba lo siguiente:
xe host-data-source-record data-source = nombre de métrica host = nombre de host
Deshabilitar una métrica específica
Es posible que no desee recopilar determinadas métricas regularmente. Para deshabilitar una métrica habilitada anteriormente, escriba lo siguiente:
xe host-data-source-forget data-source = nombre de métrica host = nombre de host
Mostrar una lista de métricas de host habilitadas actualmente
Para enumerar las métricas de host que se están recopilando actualmente, introduzca lo siguiente:
xe host-data-source-list host = hostname
Mostrar una lista de métricas de VM habilitadas actualmente
Para alojar las métricas de VM que se están recopilando actualmente, escriba lo siguiente:
xe vm-data-source-list vm = vm_name
Usar RRD
utiliza RRD para almacenar métricas de rendimiento. Estos RRD consisten en varios archivos Round Robin (RRA) en una base de datos de tamaño fijo.
Cada archivo de la base de datos muestra su métrica particular en una granularidad especificada:
- Cada 5 segundos durante 10 minutos
- Cada minuto de las últimas dos horas
- Cada hora de la semana pasada
- Todos los días del año pasado
El muestreo que se lleva a cabo cada cinco segundos registra puntos de datos reales, sin embargo, las siguientes RRA usan funciones de consolidación en su lugar. Las funciones de consolidación soportadas por son:
- PROMEDIO
- MÍN
- MÁX
Existen RRD para VM individuales (incluyendo dom0) y el host. Los RRD de VM se almacenan en el host en el que se ejecutan, o en el maestro de grupo cuando no se ejecutan. Por lo tanto, debe conocerse la ubicación de una máquina virtual para recuperar los datos de rendimiento asociados.
Para obtener información detallada sobre cómo utilizar RRD, consulte la Guía del Kit de Desarrollo de Software .
Analizar RRD usando HTTP
Puede descargar RRD a través de HTTP desde el host especificado utilizando el controlador HTTP registrado en/host_rrd o/vm_rrd . Ambas direcciones requieren autenticación mediante autenticación HTTP o proporcionando referencias de sesión de API de administración válidas como argumento de consulta. Por ejemplo:
Descargar un RRD de Host.
wget http://server/host_rrd?session_id=OpaqueRef:SESSION MANO >
Descargue un RRD de VM.
wget http://server/vm_rrd?session_id=OpaqueRef:SESSION HANDLE > & uuid = UUID de VM >
Ambas llamadas descargan XML en un formato que se puede importar alrrdtool for analysis o analizar directamente.
Para obtener información detallada sobre cómo usar RRD con HTTP, consulte xenserver.org.
Analizar RRD usando rrd2csv
Además de ver las métricas de rendimiento en , la herramienta rrd2csv registra los RRD en formato de valor separado por comas (CSV). Se proporcionan páginas de manual y de ayuda. Para mostrar el comando man de la herramienta rrd2csv o las páginas de ayuda, ejecute el siguiente comando:
man rrd2csv
O
rrd2csv — ayuda
Nota:
Cuando se utilicen varias opciones, suministren individualmente. Por ejemplo: para devolver tanto el UUID como el nombre de la etiqueta asociada a una máquina virtual o un host, llame a rrd2csv como se muestra a continuación:
rrd2csv -u -nEl UUID devuelto es único y adecuado como clave principal, sin embargo, la etiqueta de nombre de una entidad puede no ser necesariamente única.
La página de manual (rrd2csv --help) es el texto de ayuda definitivo de la herramienta.
Alertas
Puede configurar para generar alertas basadas en cualquiera de las métricas de host o VM disponibles. Además, proporciona alarmas preconfiguradas que se activan cuando los hosts sufren ciertas condiciones y estados. Puede ver estas alertas usando o la CLI xe.
Ver alertas usando
Puede ver diferentes tipos de alertas en haciendo clic en Notificaciones y, a continuación, en Alertas . La vista Alertas muestra varios tipos de alertas, incluidas las alertas de rendimiento, las alertas del sistema y las alertas de actualización de software.
Alertas de rendimiento
Las alertas de rendimiento se pueden generar cuando uno de los siguientes valores supera un umbral especificado en un host administrado, VM o repositorio de almacenamiento (SR): uso de CPU, uso de red, uso de memoria, uso de memoria de dominio de control, rendimiento de almacenamiento o uso de disco de VM.
De forma predeterminada, el intervalo de repetición de alerta se establece en 60 minutos, se puede modificar si es necesario. Las alertas se muestran en la página Alertas del área Notificaciones de . También puede configurar para enviar un correo electrónico para cualquier alerta de rendimiento especificada junto con otras alertas serias del sistema.
Las alertas personalizadas que se configuran mediante la CLI xe también se muestran en la página Alertas de .
Cada alerta tiene un nivel de prioridad/gravedad correspondiente. Puede modificar estos niveles y opcionalmente elegir recibir un correo electrónico cuando se active la alerta. La prioridad/gravedad de la alerta predeterminada se establece en3.
| Prioridad | Nombre | Descripción | Alerta de correo electrónico predeterminada |
|---|---|---|---|
| 1 | Crítica | Actúe ahora o los datos pueden ser perdidos/dañados permanentemente. |
|
| 2 | Mayor | Actuar ahora o algunos servicios pueden fallar. |
|
| 3 | Advertencia | Actúa ahora o un servicio puede sufrir. |
|
| 4 | Menor | Observe que algo acaba de mejorar. | No |
| 5 | Información | Información diaria (Inicio, Detener, Reanudar, etc.) | No |
| ? | Desconocido | Error desconocido | No |
Configurar alertas de rendimiento
-
En el panel Recursos , seleccione el host, VM o SR relevantes y, a continuación, haga clic en la ficha General y, a continuación, en Propiedades .
-
Haga clic en la ficha Alertas . Puede configurar las siguientes alertas:
-
Alertas deuso de CPU para un host o VM: Active la casilla de verificación Generar alertas de uso de CPU y, a continuación, establezca el uso de CPU y el umbral de tiempo que activan la alerta
-
Alertas deuso de red para un host o VM: active la casilla Generar alertas de uso de red y, a continuación, establezca el uso de red y el umbral de tiempo que activan la alerta.
-
Alertas deuso de memoria para un host: active la casilla Generar alertas de uso de memoria y, a continuación, establezca la memoria libre y el umbral de tiempo que activan la alerta.
-
Controlar alertas de uso de memoria de dominio para un host: active la casilla Generar alertas de uso de memoria de dominio de control y, a continuación, establezca el uso de memoria de dominio de control y el umbral de tiempo que activan la alerta.
-
Alertas deuso de disco para una máquina virtual: active la casilla Generar alertas de uso de disco y, a continuación, establezca el uso del disco y el umbral de tiempo que activan la alerta.
-
Alertasde rendimiento de almacenamiento para un SR: Active la casilla de verificación Generar alertas de rendimiento de almacenamiento y, a continuación, establezca el rendimiento de almacenamiento y el umbral de tiempo que activan la alerta.
Nota:
Los dispositivos de bloqueo físico (PBD) representan la interfaz entre un host específico y un SR conectado. Cuando la actividad total de rendimiento SR de lectura/escritura en un PBD supera el umbral especificado, se generan alertas en el host conectado al PBD. A diferencia de otras alertas de host, esta alerta debe configurarse en el SR.
-
-
Para cambiar el intervalo de repetición de alerta, introduzca el número de minutos en el cuadro Intervalo de repetición de alerta . Cuando se ha alcanzado un umbral de alerta y se ha generado una alerta, no se genera otra alerta hasta que haya transcurrido el intervalo de repetición de alerta.
-
Haga clic en Aceptar para guardar los cambios.
Para obtener detalles completos sobre cómo ver, filtrar y configurar las severidades de las alertas de rendimiento, consulte la ayuda.
Alertas del sistema
En la tabla siguiente se muestran los eventos/condiciones del sistema que desencadenan una alerta que se mostrará en la página Alertas de .
| Nombre | Prioridad/gravedad | Descripción |
|---|---|---|
| license_expires_soon | 2 | El contrato de licencia caduca pronto. |
| ha-statefile_lost | 2 | Pérdida de contacto con el repositorio de almacenamiento de alta disponibilidad, actúe pronto. |
| ha-heartbeat_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciar a menos que se tome una acción. |
| ha_statefile_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciar a menos que se tome una acción. |
| haxapi_healthcheck_approaching_timeout | 5 | La alta disponibilidad se acerca al tiempo de espera, el host puede reiniciar a menos que se tome una acción. |
| ha_network_bonding_error | 3 | Posible pérdida de servicio. Pérdida de red que envía latido de alta disponibilidad. |
| ha_pool_sobrecomprometido | 3 | Posible pérdida de servicio. La alta disponibilidad no puede garantizar la protección de las máquinas virtuales configuradas. |
| ha_poor_drop_in_plan_exists_for | 3 | La cobertura de alta disponibilidad ha disminuido, es más probable que falle, aún no hay pérdida. |
| ha_protected_vm_restart_failed | 2 | Pérdida de servicio. La alta disponibilidad no pudo reiniciar una máquina virtual protegida. |
| ha_host_failed | 3 | Se detectó un error de alta disponibilidad en un host. |
| ha_host_was_fenced | 4 | La alta disponibilidad reinició un host para protegerlo contra daños en la VM. |
| redo_log_healthy | 4 | El redo log de XAPI se ha recuperado de un error anterior. |
| redo_log_broken | 3 | El redo log de XAPI ha encontrado un error. |
| ip_configured_pif_can_unplug | 3 | Una NIC configurada por IP puede ser desenchufada por XAPI cuando se utiliza alta disponibilidad, lo que posiblemente conduce a un fallo de alta disponibilidad. |
| host_sync_data_failed | 3 | Error al sincronizar las estadísticas de rendimiento. |
| host_clock_skew_detected | 3 | El reloj del host no se sincroniza con otros hosts del grupo. |
| host_clock_went_backwards | 1 | El reloj del host está dañado. |
| pool_master_transition | 4 | Se ha especificado un nuevo host como Pool Master. |
| pbd_plug_failed_on_server_start | 3 | El host no pudo conectarse al almacenamiento en el momento del arranque. |
| auth_external_init_failed | 2 | El host no pudo habilitar la autenticación de AD externa. |
| auth_external_pool_no homogéneo | 2 | Los hosts de un grupo tienen una configuración de autenticación de AD diferente. |
| multipath_period_alert | 3 | Se ha producido un error o se ha recuperado una ruta a un SR. |
| Bond-status-changed | 3 | Un vínculo de un vínculo se ha desconectado o se ha vuelto a conectar. |
Alertas de actualización de software
- antiguo: espera una versión más reciente pero aún puede conectarse a la versión actual
- obsoleto: es demasiado viejo para conectarse a
- **obsoleto: ** es una versión antigua a la que el actual no puede conectarse
- Alerta de licencia caducada: la licencia ha caducado
- Falta la alerta de IQN: usa almacenamiento iSCSI pero el IQN del host está vacío
- Alerta de IQN duplicada: utiliza almacenamiento iSCSI y hay IQN de host duplicados
Configurar alertas de rendimiento mediante la CLI xe
Nota:
Los desencadenadores de las alertas se comprueban con un intervalo mínimo de cinco minutos. Este intervalo evita colocar una carga excesiva en el sistema para verificar estas condiciones y reportar falsos positivos. Si se establece un intervalo de repetición de alerta inferior a cinco minutos, las alertas siguen siendo generadas en el intervalo mínimo de cinco minutos.
Laperfmon herramienta de supervisión del rendimiento se ejecuta una vez cada cinco minutos y solicita actualizaciones de las cuales son promedios superiores a un minuto. Estos valores predeterminados se pueden cambiar en/etc/sysconfig/perfmon.
Laperfmon herramienta lee actualizaciones cada cinco minutos de variables de rendimiento que se ejecutan en el mismo host. Estas variables se separan en un grupo relacionado con el propio host y un grupo para cada máquina virtual que se ejecuta en ese host. Para cada máquina virtual y host,perfmon lee el parámetroother-config:perfmon y utiliza esta cadena para determinar qué variables supervisar y en qué circunstancias generar un mensaje.
Por ejemplo, a continuación se muestra un ejemplo de configuración de una alerta de “uso de CPU” de VM escribiendo una cadena XML en el parámetroother-config:perfmon:
xe vm-param-set uuid = vm_uuid other-config: perfmon =\
< config >'
< variable >
< name value = “cpu_usage” / >
< alarm_trigger_level value = "0.5" / >
< / variable >
'< / config >
Nota:
Puede usar varios nodos variables.
Después de configurar la nueva configuración, utilice el siguiente comando para actualizarperfmon para cada host:
xe host-call-plugin host = host_uuid plugin = perfmon fn = refresh
Si no se realiza esta actualización, hay un retraso antes de que la nueva configuración surta efecto, ya que de forma predeterminada,perfmon comprueba la configuración nueva cada 30 minutos. Este valor predeterminado se puede cambiar en/etc/sysconfig/perfmon.
Elementos de VM válidos
-
name: el nombre de la variable (sin valor predeterminado). Si el valor del nombre escpu_usagenetwork_usage````, odisk_usage, losalarm\_trigger\_senseparámetrosrrd_regex``y no son necesarios como valores predeterminados para estos valores se utilizan. -
alarm_priority: la prioridad de las alertas generadas (por defecto3). -
alarm_trigger_level: el nivel de valor que activa una alerta (sin valor predeterminado). -
alarm_trigger_sense: El valor eshighsialarm_trigger_leveles un valor máximo de lo contrariolowsi elalarm_trigger_leveles un valor mínimo (el valor predeterminadohigh). -
alarm_trigger_period: el número de segundos que se pueden recibir valores (por encima o por debajo del umbral de alerta) antes de enviar una alerta (el valor predeterminado es60). -
alarm_auto_inhibit_period: el número de segundos que esta alarma se desactivará después de enviar una alarma (el valor predeterminado es3600). -
consolidation_fn: combina variables de rrd_updates en un solo valor. Paracpu-usageel predeterminado esaverage, parafs_usageel predeterminado esget_percent_fs_usagey para todos los demás -sum. -
rrd_regex: coincide con los nombres de las variables dexe vm-data-sources-list uuid=vm_uuid, para calcular los valores de rendimiento. Este parámetro tiene valores predeterminados para las variables con nombre:- cpu_usage
- network_usage
- uso_disco
Si se especifica, los valores de todos los elementos devueltos porxe vm-data-source-list cuyos nombres coinciden con la expresión regular especificada se consolidan utilizando el método especificado comoconsolidation_fn .
Elementos de host válidos
-
name: el nombre de la variable (sin valor predeterminado). -
alarm_priority: la prioridad de las alertas generadas (por defecto3). -
alarm_trigger_level: el nivel de valor que activa una alarma (sin valor predeterminado). -
alarm_trigger_sense: el valor eshighcuandoalarm_trigger_leveles un valor máximo de lo contrariolowsi elalarm_trigger_leveles un valor mínimo. (predeterminadohigh) -
alarm_trigger_period: el número de segundos que se pueden recibir valores (por encima o por debajo del umbral de alerta) antes de enviar una alarma (predeterminado60). -
alarm_auto_inhibit_period: el número de segundos para los que la alerta está deshabilitada después de enviar una alerta. (valor predeterminado3600). -
consolidation_fn: Combina variables derrd_updatesen un valor (predeterminadosum- oaverage) -
rrd_regex: una expresión regular para que coincida con los nombres de variables devueltos por elxe vm-data-source-list uuid=vm_uuidcomando para utilizar para calcular el valor estadístico. Este parámetro tiene valores predeterminados para las siguientes variables con nombre:- cpu_usage
- network_usage
- memory_free_kib
- sr_io_throughput_total_xxxxxxxx (donde
xxxxxxxxson los primeros ocho caracteres del SR-UUID).
Nota:**Rendimiento de
SR**: Las alertas de rendimiento de almacenamiento deben configurarse en el SR en lugar del host. Por ejemplo:
xe sr-param-set uuid = sr_uuid other-config: perfmon =\ < config >' < variable > < name value = “sr_io_throughput_total_per_host” / > < alarm_trigger_level value = "0.01" / > < / variable > '< / config >
Configuración de ejemplo genérico
En el ejemplo siguiente se muestra una configuración genérica:
< config >
< variable >
< name value = “NAME_CHOSEN_BY_USER” / >
< alarm_trigger_level value = “THRESHOLD_LEVEL_FOR_ALARM” / >
< alarm_trigger_period value = “RAISE_ALARM_AFTER_THIS_MANY_SECONDS_OF_BAD_VALUES” / >
< alarm_priority value = “PRIORITY_LEVEL” / >
< alarm_trigger_sense value = “HIGH_OR_LOW” / >
< alarm_auto_inhibit_period value = “MINIMUM_TIME_BETWEEN_ALARMS_FROM_THIS_MONITOR” / >
< consolidation_fn value = “FUNCTION_FOR_COMBINING_VALUES” / >
< rrd_regex value = “REGULAR_EXPRESSION_TO_CHOOSE_DATASOURCE_METRIC” / >
< / variable >
< variable >
...
< / variable >
...
< / config >
Configurar alertas de correo electrónico
Puede configurar para enviar notificaciones por correo electrónico cuando los hosts generan alertas. Esta configuración se puede realizar mediante , o mediante el uso de la interfaz de línea de comandos xe (CLI).
Habilitar alertas de correo electrónico mediante
-
En el panel Recursos, haga clic con el botón derecho en un grupo y seleccione Propiedades.
-
En la ventana Propiedades, seleccione Opciones de correo electrónico.
-
Active la casilla de verificación Enviar notificaciones de alerta por correo electrónico e introduzca la dirección de correo electrónico y los detalles del servidor SMTP.
Nota:
Introduzca los detalles de un servidor SMTP que no requiere autenticación
-
Elija el idioma preferido de la lista Idioma del correo para recibir el correo electrónico de alerta de rendimiento. Los tres idiomas disponibles son inglés, chino y japonés.
Habilitar alertas de correo electrónico mediante la CLI xe
Importante:
Cuando utilice o la CLI xe para habilitar las notificaciones por correo electrónico, introduzca los detalles de un servidor SMTP, que no requiere autenticación. Los correos electrónicos enviados a través de servidores SMTP que requieren autenticación no se entregan.
Para configurar alertas de correo electrónico, especifique la dirección de correo electrónico y el servidor SMTP:
xe pool-param-set uuid = pool_uuid other-config: mail-destination = joe.bloggs@domain.tld
xe pool-param-set uuid = pool_uuid other-config: ssmtp-mailhub = smtp.domain.tld [: puerto]
También puede especificar el valor mínimo del campo de prioridad (conocido como “gravedad” en ) en el mensaje antes de enviar el correo electrónico:
xe pool-param-set uuid = pool_uuid other-config: mail-max-priority = level
El nivel de prioridad predeterminado es4.
Nota:
Algunos servidores SMTP sólo reenvían correos con direcciones que utilizan FQDN. Si encuentra que los correos electrónicos no se están reenviando, podría ser por este motivo. En cuyo caso, puede establecer el nombre de host del servidor en el FQDN para que esta dirección se utilice al conectarse al servidor de correo.
Para configurar el idioma de correo de alerta de rendimiento:
xe pool-param-set uuid = pool\_uuid other-config: mail-language = es-ES | Zh-CN | JA-JP
Enviar alertas de correo electrónico a través de servidores SMTP autenticados
La utilidad mail-alarm de utiliza sSMTP para enviar notificaciones por correo electrónico. Antes de enviar notificaciones por correo electrónico, la utilidad mail-alarm busca el archivo de configuración,mail-alarm.conf. Si el archivo de configuración existe, el contenido del archivo se utiliza para configurar sSMTP. De lo contrario, los detalles disponibles en la base de datos XAPI (tal y como se configura mediante o la CLI xe) se utilizan para enviar alertas por correo electrónico. Para enviar notificaciones por correo electrónico a través de servidores SMTP autenticados, cree unmail-alarm.conf archivo/etc/ con el siguiente contenido:
root = postmaster
< username >AuthUser =
< password >AuthPass =
< port >hub de correo = < server address >:
Nota:
Este archivo de configuración se utiliza para todas las alertas generadas por los hosts.
Opciones de configuración adicionales
Cada servidor SMTP puede diferir ligeramente en su configuración y puede requerir una configuración adicional. El siguiente extracto de la página del comandossmtp.conf man muestra la sintaxis correcta y las opciones disponibles:
NOMBRE
ssmtp.conf — archivo de configuración ssmtp
DESCRIPCIÓN
ssmtp lee los datos de configuración de /etc/ssmtp/ssmtp.conf El archivo con-
contiene pares de palabras clave y argumentos, uno por línea. Líneas que empiecen por '#'
y las líneas vacías se interpretan como comentarios.
Las posibles palabras clave y sus significados son los siguientes (ambos son caso-
insensible):
Raíz
El usuario que obtiene todo el correo para usuarios menores de 1000. Si está en blanco,
está deshabilitada la reescritura de direcciones.
Buje de correo
El host al que enviar correo, en la forma host | puerto IP\_addr \[:
puerto]. El puerto predeterminado es 25.
ReescribidoMain
El dominio del que parece venir el correo. Para la autenticación de usuario.
Nombre de host
Nombre completo completo del host . Si no se especifica, el host
es consultado por su nombre de host.
FromLineOverride
Especifica si el encabezado De de un correo electrónico, en su caso, puede sobre-
recorrer el dominio predeterminado. El valor predeterminado es “no”.
UTITLS
Especifica si ssmtp usa TLS para hablar con el servidor SMTP.
El valor predeterminado es “no”.
UsoStartls
Especifica si ssmtp hace un EHLO/STARTTLS antes de iniciar SSL
negociación. Véase RFC 2487.
TLSCert
El nombre de archivo de un certificado RSA que se va a utilizar para TLS, si es necesario.
AuthUser
El nombre de usuario que se va a utilizar para SMTP AUTH. El valor predeterminado está vacío, en
en cuyo caso no se utiliza SMTP AUTH.
AuthPass
La contraseña que se va a utilizar para SMTP AUTH.
AuthMethod
El método de autorización que se va a utilizar. Si no se establece, se utiliza texto sin formato.
También se puede establecer en "cram-md5".
Campos y etiquetas personalizados
admite la creación de etiquetas y campos personalizados, lo que permite la organización y búsqueda rápida de máquinas virtuales, almacenamiento, etc. Consulte la Ayuda para obtener más información.
Búsquedas personalizadas
admite la creación de búsquedas personalizadas. Las búsquedas se pueden exportar e importar, y los resultados de una búsqueda se pueden mostrar en el panel de exploración. Consulte la Ayuda para obtener más información.
Determinar el rendimiento de los adaptadores de bus físicos
Para HBAs FC, SAS e iSCSI, puede determinar el rendimiento de red de sus PBD mediante el procedimiento siguiente.
- Enumere los PBD de un host.
- Determine qué LUNs se enrutan sobre qué PBD.
- Para cada PBD y SR, enumere los VBD que hacen referencia a VDIS en SR.
- Para todos los VBD activos que están conectados a las máquinas virtuales del host, calcule el rendimiento combinado.
Para el almacenamiento iSCSI y NFS, compruebe las estadísticas de red para determinar si existe un cuello de botella de rendimiento en el arreglo de discos o si el PBD está saturado. ```