XenServer

Surveiller et gérer votre déploiement

XenServer fournit une surveillance détaillée des indicateurs de performance. Ces mesures incluent le processeur, la mémoire, le disque, le réseau, les informations sur l’état C-State/P-State et le stockage. Le cas échéant, ces métriques sont disponibles par hôte et par machine virtuelle. Ces mesures sont disponibles directement ou peuvent être consultées et affichées graphiquement dans XenCenter ou d’autres applications tierces.

XenServer fournit également des alertes relatives au système et aux performances. Les alertes sont des notifications qui se produisent en réponse à des événements système sélectionnés. Ces notifications se produisent également lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle. Vous pouvez configurer les alertes à l’aide de l’interface de ligne de commande xe ou à l’aide de XenCenter. Pour créer des notifications en fonction de l’une des mesures de performances de l’hôte ou de la machine virtuelle disponibles, consultez Alertes de performances.

Surveiller les performances de XenServer

Les clients peuvent surveiller les performances de leurs hôtes XenServer et de leurs machines virtuelles (VM) à l’aide des métriques exposées par le biais des bases de données Round Robin (RRD). Ces métriques peuvent être interrogées via HTTP ou via l’outil RRD2CSV. En outre, XenCenter utilise ces données pour produire des graphiques de performance du système. Pour plus d’informations, voir Analyser et visualiser des mesures.

Les tableaux suivants répertorient toutes les mesures disponibles sur les hôtes et les machines virtuelles.

Remarques :

  • La latence sur une période est définie comme la latence moyenne des opérations pendant cette période.
  • La disponibilité et l’utilité de certaines métriques dépendent du SR et du processeur.

Métriques d’hôtes disponibles

Nom de la métrique Description Condition Nom XenCenter
avgqu_sz_<sr-uuid-short> Taille moyenne de la file d’attente d’E/S (demandes). Au moins un VBD branché <sr-uuid-short> sur SR sur l’hôte sr-uuid-short Taille de la file
cpu<cpu>-C<cstate> Temps cpu passé par le processeur dans l’état C cstate en millisecondes. L’état C existe sur le processeur CPU cpu C-state cstate
cpu<cpu>-P<pstate> Temps cpu passé par le processeur dans l’état P pstate en millisecondes. L’état P existe sur le processeur CPU cpu P-state pstate
cpu<cpu> Utilisation du processeur physique cpu (fraction). Activé par défaut. Le processeur cpu existe CPU cpu
cpu_avg Utilisation moyenne des processeurs physiques (fraction). Activé par défaut. Aucun UC moyenne
hostload Charge de l’hôte par processeur physique, où la charge fait référence au nombre de processeurs virtuels en cours d’exécution ou exécutables. Aucun Charge du processeur hôte
inflight_<sr-uuid-short> Nombre de demandes d’E/S actuellement en cours. Activé par défaut. Au moins un VBD branché sr sur SR sur l’hôte sr Demandes en vol
io_throughput_read_<sr-uuidshort> Données lues à partir du SR (Mio/s). Au moins un VBD branché sr sur SR sur l’hôte sr Débit de lecture
io_throughput_write_<sr-uuidshort> Données écrites dans le SR (Mio/s). Au moins un VBD branché sr sur SR sur l’hôte sr Débit d’écriture
io_throughput_total_<sr-uuidshort> Toutes les E/S SR (Mio/s). Au moins un VBD branché sr sur SR sur l’hôte sr Débit total
iops_read_<sr-uuid-short> Demandes de lecture par seconde. Au moins un VBD branché sr sur SR sur l’hôte sr IOPS en lecture
iops_write_<sr-uuid-short> Demandes d’écriture par seconde. Au moins un VBD branché sr sur SR sur l’hôte sr IOPS en écriture
iops_total_<sr-uuid-short> Demandes d’E/S par seconde. Au moins un VBD branché sr sur SR sur l’hôte sr IOPS totales
iowait_<sr-uuid-short> Pourcentage du temps d’attente pour les E/S. Au moins un VBD branché sr sur SR sur l’hôte Attente des E/S sr
latency_<sr-uuid-short> Latence moyenne des E/S (millisecondes). Au moins un VBD branché sr sur SR sur l’hôte sr Latence
loadavg Moyenne de charge Domain0. Activée par défaut Aucun Charge du domaine de contrôle
memory_free_kib Quantité totale de mémoire libre (Kio). Activé par défaut. Aucun Non présent dans XenCenter. Remplacé par Used Memory.
Non signalé par la pile d’outils. Calculé par XenCenter. Quantité totale de mémoire utilisée (KiB). Activé par défaut. Aucun Mémoire utilisée
memory_reclaimed Mémoire de l’hôte récupérée par Squeeze (B). Aucun Mémoire récupérée
memory_reclaimed_max Mémoire hôte disponible pour récupération avec Squeeze (B). Aucun Mémoire potentiellement récupérée
memory_total_kib Quantité totale de mémoire (Ko) de l’hôte. Activé par défaut. Aucun Total Memory
network/latency Intervalle en secondes entre les deux derniers battements cardiaques transmis par l’hôte local à tous les hôtes en ligne. Désactivé par défaut. HA activé Latence du réseau
statefile/<vdi_uuid>/latency Délai d’exécution en secondes du dernier accès au State-File depuis l’hôte local. Désactivé par défaut. HA activé Latence des fichiers d’état HA
pif_<pif>_rx Octets par seconde reçus sur l’interface physiquepif. Activé par défaut. Le PIF existe XenCenter-pifname Recevoir (voir remarque)
pif_<pif>_tx Octets par seconde envoyés sur l’interface physique pif. Activé par défaut. Le PIF existe XenCenter-pifname Envoyer (voir remarque)
pif_<pif>_rx_errors Recevez des erreurs par seconde sur l’interface physique pif. Désactivé par défaut. Le PIF existe XenCenter-pifname Erreurs de réception (voir remarque)
pif_<pif>_tx_errors Erreurs de transmission par seconde sur l’interface physique pif . Désactivé par défaut Le PIF existe XenCenter-pifname Erreurs d’envoi (voir remarque)
pif_aggr_rx Octets par seconde reçus sur toutes les interfaces physiques. Activé par défaut. Aucun Total de réception de la carte réseau
pif_aggr_tx Octets par seconde envoyés sur toutes les interfaces physiques. Activé par défaut. Aucun Total des envois par carte réseau
pvsaccelerator_evicted Octets par seconde supprimés du cache PVSAccelerator activé Taux d’expulsion de l’accélérateur PVS
pvsaccelerator_read_hits Lectures par seconde diffusées à partir du cache PVSAccelerator activé Taux de réussite de PVSAccelerator
pvsaccelerator_read_misses Lectures par seconde qui ne peuvent pas être diffusées à partir du cache PVSAccelerator activé Taux d’échec d’accélérateur PVS
pvsaccelerator_traffic_client_sent Octets par seconde envoyés par les clients PVS mis en cache PVSAccelerator activé PVS-Accelerator a observé le trafic réseau des clients
pvsaccelerator_traffic_server_sent Octets par seconde envoyés par les serveurs PVS mis en cache PVSAccelerator activé PVS-Accelerator a observé le trafic réseau provenant des serveurs
pvsaccelerator_read_total Lectures par seconde observées par le cache PVSAccelerator activé Taux de lecture observé par l’accélérateur PVS
pvsaccelerator_traffic_proxy_saved Octets par seconde envoyés par PVSAcelerator au lieu du serveur PVS PVSAccelerator activé Trafic réseau économisé PVS-Accelerator
pvsaccelerator_space_utilization Pourcentage d’espace utilisé par PVSAcelerator sur cet hôte, par rapport à la taille totale du stockage du cache PVSAccelerator activé Utilisation de l’espace PVS-Accelerator
running_vcpus Le nombre total de processeurs virtuels en cours d’exécution Aucun Nombre de processeurs virtuels en cours d’exécution
running_domains Le nombre total de domaines en cours d’exécution, y compris dom0 (le domaine de contrôle de l’hôte) Aucun Nombre de domaines en cours d’exécution
sr_<sr>_cache_size Taille en octets de la SR IntelliCache. Activé par défaut. IntelliCache activé Taille du cache IntelliCache
sr_<sr>_cache_hits Nombre de visites du cache par seconde. Activé par défaut. IntelliCache activé Accès au cache IntelliCache
sr_<sr>_cache_misses Manque de cache par seconde. Activé par défaut. IntelliCache activé Manques du cache IntelliCache
xapi_allocation_kib Allocation de mémoire (Kio) effectuée par le démon XAPI. Activé par défaut. Aucun Allocation de mémoire à l’agent
xapi_free_memory_kib Mémoire libre (Ko) disponible pour le démon XAPI. Activé par défaut. Aucun Mémoire de l’agent libre
xapi_healthcheck/latency Délai d’exécution en secondes du dernier appel de surveillance de l’état XAPI sur l’hôte local. Désactivé par défaut. Haute disponibilité activée Latence de haute disponibilité de XenServer
xapi_live_memory_kib Mémoire en direct (Kio) utilisée par le démon XAPI. Activé par défaut. Aucun Mémoire de l’agent live
xapi_memory_usage_kib Mémoire totale (Ko) allouée utilisée par le démon XAPI. Activé par défaut. Aucun Utilisation de la mémoire de l’agent

Métriques de VM disponibles

Nom de la métrique Description Condition Nom XenCenter
cpu<cpu> Utilisation du processeur virtuel cpu (fraction). Activée par défaut vCPU cpu exists UC
cpu_usage Utilisation du processeur du domaine Aucun cpu_usage
memory Mémoire actuellement allouée à la machine virtuelle (octets) .Activé par défaut Aucun Total Memory
memory_target Cible du pilote de ballon VM (octets). Activée par défaut Aucun Memory target
memory_internal_free Mémoire utilisée telle que signalée par l’agent invité (KiB). Activée par défaut Aucun Free Memory
runstate_fullrun Fraction de temps pendant laquelle tous les processeurs virtuels sont en cours d’exécution. Aucun vCPUs full run
runstate_full_contention Fraction de temps pendant laquelle tous les processeurs virtuels peuvent être exécutés (c’est-à-dire en attente du processeur) Aucun vCPUs full contention
runstate_concurrency_hazard Fraction de temps pendant laquelle certains processeurs virtuels sont en cours d’exécution et d’autres sont exécutables Aucun vCPUs concurrency hazard
runstate_blocked Fraction de temps pendant laquelle tous les processeurs virtuels sont bloqués ou hors ligne Aucun vCPUs idle
runstate_partial_run Fraction de temps pendant laquelle certains processeurs virtuels sont en cours d’exécution et d’autres sont bloqués Aucun vCPUs partial run
runstate_partial_contention Fraction de temps pendant laquelle certains processeurs virtuels peuvent être exécutés et d’autres sont bloqués Aucun vCPUs partial contention
vbd_<vbd>_write Écrit sur le périphérique vbd en octets par seconde. Activée par défaut VBD vbd exists Disk vbd Write
vbd_<vbd>_read Lit depuis le périphérique vbd en octets par seconde. Activé par défaut. VBD vbd exists Disk vbd Read
vbd_<vbd>_write_latency Écrit sur le périphérique vbd en microsecondes. VBD vbd exists Disk vbd Write Latency
vbd_<vbd>_read_latency Lit depuis l’appareil vbd en microsecondes. VBD vbd exists Disk vbd Read Latency
vbd <vbd>_iops_read Demandes de lecture par seconde. Au moins un VBD branché pour VDI non ISO sur l’hôte Disk vbd Read IOPs
vbd <vbd>_iops_write Demandes d’écriture par seconde. Au moins un VBD branché pour VDI non ISO sur l’hôte E/S par seconde en écriture sur disque vbd
vbd <vbd>_iops_total Demandes d’E/S par seconde. Au moins un VBD branché pour VDI non ISO sur l’hôte Disk vbd Total IOPS
vbd <vbd>_iowait Pourcentage de temps d’attente pour I/0. Au moins un VBD branché pour VDI non ISO sur l’hôte Disk vbd IO Wait
vbd <vbd>_inflight Nombre de demandes d’E/S actuellement en cours. Au moins un VBD branché pour VDI non ISO sur l’hôte Disk vbd Inflight Requests
vbd <vbd>_avgqu_sz Taille moyenne de la file d’E/S. Au moins un VBD branché pour VDI non ISO sur l’hôte Disk vbd Queue Size
vif_<vif>_rx Octets par seconde reçus sur le numéro d’interface virtuelle vif. Activé par défaut. VIF vif exists vif Receive
vif_<vif>_tx Octets par seconde transmis sur l’interface virtuelle vif. Activé par défaut. VIF vif exists vif Envoyer
vif_<vif>_rx_errors Recevez des erreurs par seconde sur l’interface virtuelle vif. Activé par défaut. VIF vif exists vif Receive Errors
vif_<vif>_tx_errors Erreurs de transmission par seconde sur l’interface virtuelle vif Activé par défaut. VIF vif exists vif Send Errors

Remarque :

La valeur de <XenCenter-pif-name> peut être l’une des valeurs suivantes :

  • NIC <pif> - si <pif> contient pif_eth#, où ## est compris entre 0 et 9
  • <pif> - si <pif> contient pif_eth#.## ou pif_xenbr## ou pif_bond##
  • <Internal> Network <pif> - si <pif> contient pif_xapi##, (notez que <Internal> apparaît tel quel)
  • TAP <tap> - si <pif> contient pif_tap##
  • xapi Loopback - si <pif> contient pif_lo

Analyser et visualiser les mesures

L’onglet Performances de XenCenter fournit une surveillance en temps réel des statistiques de performances sur l’ensemble des pools de ressources, en plus des tendances graphiques des performances des machines virtuelles et physiques. Les graphiques montrant les E/S du processeur, de la mémoire, du réseau et du disque sont inclus par défaut dans l’onglet Performances. Vous pouvez ajouter d’autres mesures, modifier l’apparence des graphiques existants ou en créer d’autres. Pour plus d’informations, consultez Configuration des métriques dans la section suivante.

  • Vous pouvez afficher jusqu’à 12 mois de données de performances et effectuer un zoom avant pour regarder de plus près les pics d’activité.

  • XenCenter peut générer des alertes de performance lorsque l’utilisation du processeur, de la mémoire, des E/S réseau, des E/S de stockage ou des E/S de disque dépasse un seuil spécifié sur un hôte, une machine virtuelle ou un SR. Pour plus d’informations, consultez Alertes dans la section suivante.

Remarque :

Installez XenServer VM Tools pour consulter les données complètes sur les performances des machines virtuelles.

Configuration des graphiques de performance

Pour ajouter un graphique :

  1. Dans l’onglet Performances, cliquez sur Actions, puis sur Nouveau graphique. La boîte de dialogue Nouveau graphique s’affiche.

  2. Dans le champ Nom, entrez le nom du graphique.

  3. Dans la liste des sources de données, cochez les cases correspondant aux sources de données que vous souhaitez inclure dans le graphique.

  4. Cliquez sur Enregistrer.

Pour modifier un graphique existant :

  1. Accédez à l’onglet Performances et sélectionnez le graphique que vous souhaitez modifier.

  2. Cliquez avec le bouton droit sur le graphique et sélectionnez Actions, ou cliquez sur le bouton Actions . Sélectionnez ensuite Modifier le graphique.

  3. Dans la fenêtre des détails du graphique, apportez les modifications nécessaires, puis cliquez sur OK.

Configuration du type de graphe

Les données des graphiques de performance peuvent être affichées sous forme de lignes ou de zones. Pour modifier le type de graphique :

  1. Dans le menu Outils, cliquez sur Options et sélectionnez Graphiques.

  2. Pour afficher les données de performance sous forme de graphique linéaire, cliquez sur l’option Graphique linéaire .

  3. Pour afficher les données de performance sous forme de graphique en aires, cliquez sur l’option Graphique en aires.

  4. Cliquez sur OK pour enregistrer vos modifications.

Vous trouverez des détails complets sur la configuration et l’affichage des graphiques de performances XenCenter dans la section Surveillance des performances du systèmedans la documentation XenCenter.

Configurer les mesures

Remarque :

Les états C et P sont des fonctionnalités de gestion de l’alimentation de certains processeurs. La plage d’états disponibles dépend des capacités physiques de l’hôte, ainsi que de la configuration de la gestion de l’alimentation.

Les commandes host et VM renvoient les informations suivantes :

  • Une description complète de la source de données

  • Les unités appliquées à la métrique

  • La plage de valeurs possibles pouvant être utilisées

Par exemple :

    name_label: cpu0-C1
    name_description: Proportion of time CPU 0 spent in C-state 1
    enabled: true
    standard: true
    min: 0.000
    max: 1.000
    units: Percent
<!--NeedCopy-->

Activer une métrique spécifique

La plupart des mesures sont activées et collectées par défaut. Pour activer les mesures qui ne le sont pas, entrez ce qui suit :

xe host-data-source-record data-source=metric name host=hostname
<!--NeedCopy-->

Désactiver une métrique spécifique

Il se peut que vous ne souhaitiez pas collecter certaines statistiques régulièrement. Pour désactiver une mesure précédemment activée, entrez ce qui suit :

xe host-data-source-forget data-source=metric name host=hostname
<!--NeedCopy-->

Afficher une liste des métriques d’hôtes actuellement activées

Pour répertorier les métriques d’hôtes actuellement collectées, entrez les informations suivantes :

xe host-data-source-list host=hostname
<!--NeedCopy-->

Afficher la liste des métriques de VM actuellement activées

Pour héberger les métriques de VM en cours de collecte, entrez les informations suivantes :

xe vm-data-source-list vm=vm_name
<!--NeedCopy-->

Utiliser des RRD

XenServer utilise des RRD pour stocker les mesures de performance. Ces RRD se composent de plusieurs archives Round Robin (RRA) dans une base de données de taille fixe.

Chaque archive de la base de données échantillonne sa métrique particulière selon une granularité spécifiée :

  • Toutes les 5 secondes pendant 10 minutes
  • Toutes les minutes des deux dernières heures
  • Toutes les heures de la semaine dernière
  • Tous les jours depuis un an

L’échantillonnage qui a lieu toutes les cinq secondes enregistre les points de données réels, mais les RRA suivants utilisent des fonctions de consolidation à la place. Les fonctions de consolidation prises en charge par XenServer sont les suivantes :

  • MOYENNE
  • MIN
  • MAXIMUM

Les RRD existent pour les machines virtuelles individuelles (y compris dom0) et pour l’hôte XenServer. Les RRD de VM sont stockés sur l’hôte sur lequel ils s’exécutent, ou sur le coordinateur de pool lorsqu’ils ne sont pas en cours d’exécution Par conséquent, l’emplacement d’une machine virtuelle doit être connu pour récupérer les données de performances associées.

Pour des informations détaillées sur l’utilisation des RRD XenServer, consultez le guide du kit de développement logiciel XenServer.

Analyser les RRD à l’aide de HTTP

Vous pouvez télécharger des RRD via HTTP depuis l’hôte XenServer spécifié à l’aide du gestionnaire HTTP enregistré sur /host_rrd ou /vm_rrd. Les deux adresses nécessitent une authentification soit par authentification HTTP, soit en fournissant des références de session d’API de gestion valides en tant qu’argument de requête. Par exemple :

Téléchargez un RRD hôte.

wget http://server/host_rrd?session_id=OpaqueRef:SESSION HANDLE>
<!--NeedCopy-->

Téléchargez un RRD de machine virtuelle.

wget http://server/vm_rrd?session_id=OpaqueRef:SESSION HANDLE>&uuid=VM UUID>
<!--NeedCopy-->

Ces deux appels téléchargent le XML dans un format qui peut être importé dans le rrdtool pour analyse ou analysé directement.

Analyser les RRD à l’aide de rrd2csv

Outre l’affichage des mesures de performance dans XenCenter, l’outil rrd2csv enregistre les RRD au format CSV (Comma Separated Value). Des pages de manuel et d’aide sont fournies. Pour afficher le manuel de l’outil rrd2csv ou les pages d’aide, exécutez la commande suivante :

man rrd2csv
<!--NeedCopy-->

Ou

rrd2csv --help
<!--NeedCopy-->

Remarque :

Lorsque plusieurs options sont utilisées, fournissez-les individuellement. Par exemple : pour renvoyer à la fois l’UUID et l’étiquette de nom associés à une machine virtuelle ou à un hôte, appelez rrd2csv comme indiqué ci-dessous :

rrd2csv -u -n

L’UUID renvoyé est unique et convient comme clé primaire, mais le nom-étiquette d’une entité n’est pas nécessairement unique.

La page de manuel (rrd2csv --help) est le texte d’aide définitif de l’outil.

Alertes

Vous pouvez configurer XenServer pour générer des alertes en fonction de l’une des métriques d’hôte ou de machine virtuelle disponibles. En outre, XenServer fournit des alertes préconfigurées qui se déclenchent lorsque les hôtes sont soumis à certaines conditions et à certains états. Vous pouvez afficher ces alertes à l’aide de XenCenter ou de l’interface de ligne de commande xe.

Afficher les alertes en utilisant XenCenter

Vous pouvez afficher différents types d’alertes dans XenCenter en cliquant sur Notifications, puis sur Alertes. La vue Alertes affiche différents types d’alertes, y compris les alertes de performance, les alertes système et les alertes de mise à jour logicielle.

Alertes de performance

Des alertes de performance peuvent être générées lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage (SR) : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle.

Par défaut, l’intervalle de répétition des alertes est défini sur 60 minutes, il peut être modifié si nécessaire. Les alertes sont affichées sur la page Alertes de la zone Notifications de XenCenter. Vous pouvez également configurer XenCenter pour envoyer un e-mail pour toutes les alertes de performances spécifiées ainsi que d’autres alertes système sérieuses.

Toutes les alertes personnalisées configurées à l’aide de l’interface de ligne de commande xe sont également affichées sur la page Alertes de XenCenter.

Chaque alerte a un niveau de priorité/gravité correspondant. Vous pouvez modifier ces niveaux et éventuellement choisir de recevoir un e-mail lorsque l’alerte est déclenchée. La priorité/gravité de l’alerte par défaut est définie sur 3.

Priority Nom Description Alerte e-mail par défaut
1 Critical Agissez maintenant ou les données risquent d’être définitivement perdues/corrompues. Oui
2 Major Agissez maintenant ou certains services risquent d’échouer. Oui
3 Avertissement Agissez maintenant ou un service pourrait en pâtir. Oui
4 Mineur Notez que quelque chose vient d’être amélioré. Non
5 Information Informations quotidiennes (démarrage, arrêt, reprise des machines virtuelles, etc.) Non
? Inconnu Erreur inconnue Non

Configuration des alertes de performance

  1. Dans le volet Ressources, sélectionnez l’hôte, la machine virtuelle ou le SR approprié, puis cliquez sur l’onglet Général, puis sur Propriétés.

  2. Sélectionnez l’onglet Alertes. Le tableau suivant récapitule les alertes disponibles pour les hôtes, les machines virtuelles ou les SR :

    Nom de l’alerte Hôte VM SR Description
    Générer des alertes d’utilisation du processeur X X   Définissez l’utilisation du processeur et le seuil de temps qui déclenchent l’alerte.
    Générez des alertes d’utilisation du processeur dans le domaine de contrôle X     Définissez l’utilisation du processeur du domaine de contrôle et le seuil temporel qui déclenchent l’alerte.
    Générez des alertes d’utilisation de la mémoire X     Définissez l’utilisation de la mémoire et le seuil de temps qui déclenchent l’alerte.
    Générer des alertes d’utilisation de la mémoire du domaine de contrôle X     Définissez l’utilisation de la mémoire du domaine de contrôle et le seuil temporel qui déclenchent l’alerte.
    Générez des alertes de mémoire libre pour le domaine de contrôle X     Définissez la mémoire libre du domaine de contrôle et le seuil temporel qui déclenchent l’alerte.
    Générer des alertes d’utilisation du disque   X   Définissez l’utilisation du disque et le seuil de temps de déclenchement de l’alerte.
    Générez des alertes relatives au débit de stockage     X Définissez le débit de stockage et le seuil de temps qui déclenchent l’alerte. Remarque : les périphériques à blocs physiques (PBD) représentent l’interface entre un hôte XenServer spécifique et un SR connecté. Lorsque l’activité de débit SR totale en lecture/écriture sur un PBD dépasse le seuil spécifié, des alertes sont générées sur l’hôte connecté au PBD. Contrairement aux autres alertes d’hôte XenServer, cette alerte doit être configurée sur le SR.
    Générez des alertes d’utilisation du réseau X X   Définissez l’utilisation du réseau et le seuil de temps qui déclenchent l’alerte.

    Pour modifier l’intervalle de répétition des alertes, entrez le nombre de minutes dans la zone Intervalle de répétition des alertes . Lorsqu’un seuil d’alerte a été atteint et qu’une alerte est générée, une autre alerte n’est générée qu’après l’expiration de l’intervalle de répétition des alertes.

  3. Cliquez sur OK pour enregistrer vos modifications.

Pour obtenir des informations complètes sur la façon d’afficher, de filtrer et de configurer les niveaux de gravité pour les alertes de performance, consultez Configuration des alertes de performance dans la documentation XenCenter.

Alertes système

Le tableau suivant répertorie les événements/conditions système qui déclenchent l’affichage d’une alerte sur la page Alertes de XenCenter.

Nom Priorité/gravité Description
license_expires_soon 2 Le contrat de licence XenServer expire bientôt.
ha-statefile_lost 2 Perte de contact avec le référentiel de stockage haute disponibilité, agissez bientôt.
ha-heartbeat_approaching_timeout 5 La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise.
ha_statefile_approaching_timeout 5 La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise.
haxapi_healthcheck_approaching_timeout 5 La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise.
ha_network_bonding_error 3 Perte de service potentielle. Perte du réseau qui envoie des pulsations haute disponibilité.
ha_pool_overcommited 3 Perte de service potentielle. La haute disponibilité ne permet pas de garantir la protection des machines virtuelles configurées.
ha_poor_drop_in_plan_exists_for 3 La couverture de haute disponibilité a diminué, plus susceptible d’échouer, aucune perte n’est encore présente.
ha_protected_vm_restart_failed 2 Perte de service. La haute disponibilité n’a pas pu redémarrer une machine virtuelle protégée.
ha_host_failed 3 La haute disponibilité a détecté la défaillance d’un hôte.
ha_host_was_fenced 4 La haute disponibilité a redémarré un hôte pour se protéger contre la corruption des machines virtuelles.
redo_log_healthy 4 Le journal de rétablissement XAPI s’est rétabli suite à une erreur précédente.
redo_log_broken 3 Le journal de rétablissement XAPI a rencontré une erreur.
ip_configured_pif_can_unplug 3 Une carte réseau configurée par IP peut être débranchée par XAPI lors de l’utilisation de la haute disponibilité, ce qui peut entraîner une défaillance de la haute disponibilité.
host_sync_data_failed 3 Impossible de synchroniser les statistiques de performance de XenServer.
host_clock_skew_detected 3 L’horloge de l’hôte n’est pas synchronisée avec les autres hôtes du pool.
host_clock_went_backwards 1 L’horloge de l’hôte est corrompue.
pool_master_transition 4 Un nouvel hôte a été spécifié en tant que coordinateur de pool.
pbd_plug_failed_on_server_start 3 L’hôte n’a pas réussi à se connecter au stockage au moment du démarrage.
auth_external_init_failed 2 L’hôte n’a pas réussi à activer l’authentification AD externe.
auth_external_pool_non-homogeneous 2 Les hôtes d’un pool ont une configuration d’authentification AD différente.
multipath_period_alert 3 Un chemin d’accès à un SR a échoué ou a été rétabli.
bond-status-changed 3 Un lien d’une liaison s’est déconnecté ou reconnecté.

Alertes de mise à jour logicielle

  • XenCenter ancien : XenServer attend une version plus récente mais peut toujours se connecter à la version actuelle
  • XenCenter obsolète : XenCenter est trop ancien pour se connecter à XenServer
  • XenServer obsolète : XenServer est une ancienne version à laquelle le XenCenter actuel ne peut pas se connecter
  • Alerte d’expiration de licence : la licence XenServer a expiré
  • Alerte IQN manquante : XenServer utilise le stockage iSCSI mais l’IQN de l’hôte est vide
  • Alerte IQN dupliquée : XenServer utilise le stockage iSCSI et il existe des IQN hôtes dupliqués

Configuration des alertes de performance à l’aide de l’interface de ligne

Remarque :

Les déclencheurs d’alertes sont vérifiés à un intervalle minimum de cinq minutes. Cet intervalle évite d’imposer une charge excessive au système pour vérifier ces conditions et de signaler les faux positifs. Si vous définissez un intervalle de répétition des alertes inférieur à cinq minutes, les alertes sont toujours générées à l’intervalle minimum de cinq minutes.

L’outil de surveillance des performances perfmon s’exécute toutes les cinq minutes et demande à XenServer des mises à jour d’une durée moyenne supérieure à une minute. Ces valeurs par défaut peuvent être modifiées dans /etc/sysconfig/perfmon.

L’ perfmon outil lit les mises à jour toutes les cinq minutes des variables de performance exécutées sur le même hôte. Ces variables sont divisées en un groupe relatif à l’hôte lui-même et en un groupe pour chaque machine virtuelle exécutée sur cet hôte. Pour chaque machine virtuelle et hôte, perfmon lit le paramètre other-config:perfmon et utilise cette chaîne pour déterminer les variables à surveiller et dans quelles circonstances générer un message.

Par exemple, ce qui suit illustre un exemple de configuration d’une alerte « utilisation du processeur » de machine virtuelle en écrivant une chaîne XML dans le paramètre other-config:perfmon :

xe vm-param-set uuid=vm_uuid other-config:perfmon=\

'<config>
    <variable>
        <name value="cpu_usage"/>
        <alarm_trigger_level value="0.5"/>
    </variable>
</config>'
<!--NeedCopy-->

Remarque :

Vous pouvez utiliser plusieurs nœuds de variables.

Après avoir défini la nouvelle configuration, utilisez la commande suivante perfmon pour actualiser chaque hôte :

xe host-call-plugin host=host_uuid plugin=perfmon fn=refresh
<!--NeedCopy-->

Si cette actualisation n’est pas effectuée, il y a un délai avant que la nouvelle configuration ne prenne effet, car par défaut, perfmon vérifie la présence d’une nouvelle configuration toutes les 30 minutes. Cette valeur par défaut peut être modifiée dans/etc/sysconfig/perfmon.

Eléments VM valides

  • name: nom de la variable (pas de valeur par défaut). Si la valeur de nom est cpu_usage, network_usage, ou disk_usage, les paramètres rrd_regex et alarm_trigger_sense ne sont pas requis comme valeurs par défaut pour ces valeurs sont utilisées.

  • alarm_priority: priorité des alertes générées (par défaut 3).

  • alarm_trigger_level: niveau de valeur qui déclenche une alerte (pas par défaut).

  • alarm_trigger_sense: la valeur est high if alarm_trigger_level est une valeur maximale, low sinon s’il s’ alarm_trigger_level agit d’une valeur minimale (valeur par défaut high).

  • alarm_trigger_period: nombre de secondes pendant lesquelles des valeurs (au-dessus ou au-dessous du seuil d’alerte) peuvent être reçues avant l’envoi d’une alerte (la valeur par défaut est60).

  • alarm_auto_inhibit_period: nombre de secondes pendant lesquelles cette alerte sera désactivée après l’envoi d’une alerte (la valeur par défaut est 3600).

  • consolidation_fn: combine les variables de rrd_updates en une seule valeur. Pour cpu-usage la valeur par défaut est average, pour fs_usage la valeur par défaut estget_percent_fs_usage et pour tous les autres - sum.

  • rrd_regex: fait correspondre les noms des variables de xe vm-data-sources-list uuid=vm_uuid, pour calculer les valeurs de performance. Ce paramètre possède des valeurs par défaut pour les variables nommées :

    • cpu_usage
    • memory_internal_free
    • network_usage
    • disk_usage

S’il est spécifié, les valeurs de tous les éléments renvoyés par les noms xe vm-data-source-list dont le nom correspond à l’expression régulière spécifiée sont consolidées à l’aide de la méthode spécifiée en tant que consolidation_fn.

Eléments hôtes valides

  • name: nom de la variable (pas de valeur par défaut).
  • alarm_priority: priorité des alertes générées (par défaut 3).
  • alarm_trigger_level: niveau de valeur qui déclenche une alerte (pas par défaut).
  • alarm_trigger_sense: La valeur est high quand alarm_trigger_level est une valeur maximale sinon low si le alarm_trigger_level est un valeur minimale. (par défaut high)
  • alarm_trigger_period: nombre de secondes pendant lesquelles des valeurs (supérieures ou inférieures au seuil d’alerte) peuvent être reçues avant qu’une alerte ne soit envoyée (par défaut 60).
  • alarm_auto_inhibit_period: nombre de secondes pendant lesquelles l’alerte est désactivée après l’envoi d’une alerte. (par défaut3600).
  • consolidation_fn: combine les variables rrd_updates en une seule valeur (par défaut sum - ou average)
  • rrd_regex: expression régulière qui correspond aux noms des variables renvoyées par la commande xe vm-data-source-list uuid=vm_uuid à utiliser pour calculer la valeur statistique. Ce paramètre possède des valeurs par défaut pour les variables nommées suivantes :
    • cpu_usage
    • network_usage
    • memory_free_kib
    • sr_io_throughput_total_xxxxxxxx (où xxxxxxxxsont les huit premiers caractères de l’UUID SR-).

Débit SR : les alertes de débit de stockage doivent être configurées sur le SR plutôt que sur l’hôte. Par exemple :

xe sr-param-set uuid=sr_uuid other-config:perfmon=\
'<config>
    <variable>
        <name value="sr_io_throughput_total_per_host"/>
        <alarm_trigger_level value="0.01"/>
    </variable>
</config>'
<!--NeedCopy-->

Exemple de configuration générique

L’exemple suivant montre une configuration générique :

<config>
    <variable>
    <name value="NAME_CHOSEN_BY_USER"/>
    <alarm_trigger_level value="THRESHOLD_LEVEL_FOR_ALERT"/>
    <alarm_trigger_period value="RAISE_ALERT_AFTER_THIS_MANY_SECONDS_OF_BAD_VALUES"/>
    <alarm_priority value="PRIORITY_LEVEL"/>
    <alarm_trigger_sense value="HIGH_OR_LOW"/>
    <alarm_auto_inhibit_period value="MINIMUM_TIME_BETWEEN_ALERT_FROM_THIS_MONITOR"/>
    <consolidation_fn value="FUNCTION_FOR_COMBINING_VALUES"/>
    <rrd_regex value="REGULAR_EXPRESSION_TO_CHOOSE_DATASOURCE_METRIC"/>
    </variable>

    <variable>
    ...
    </variable>

    ...
</config>
<!--NeedCopy-->

Configuration des alertes par e-mail

Vous pouvez configurer XenServer pour envoyer des notifications par e-mail lorsque les hôtes XenServer génèrent des alertes. L’utilitaire mail-alarm de XenServer utilise SSmTP pour envoyer ces notifications par e-mail. Vous pouvez activer les alertes par e-mail de base à l’aide de XenCenter ou de l’interface de ligne de commande (CLI) xe. Pour une configuration plus poussée des alertes par e-mail, vous pouvez modifier le fichier mail-alarm.conf de configuration.

Utilisez un serveur SMTP qui ne nécessite pas d’authentification. Les e-mails envoyés via des serveurs SMTP qui nécessitent une authentification ne peuvent pas être distribués.

Activer les alertes par e-mail à l’aide de XenCenter

  1. Dans le volet Resources, cliquez avec le bouton droit sur un pool et sélectionnez Properties.

  2. Dans la fenêtre Properties, sélectionnez Email Options.

  3. Cochez la case Send email alert notifications. Entrez votre adresse de destination préférée pour les e-mails de notification et les détails du serveur SMTP.

  4. Choisissez la langue de votre choix dans la liste Mail language. La langue par défaut pour les e-mails d’alerte de performance est l’anglais.

Activer les alertes par e-mail à l’aide de l’interface de ligne

Pour configurer les alertes par e-mail, spécifiez votre adresse de destination préférée pour les e-mails de notification et le serveur SMTP :

xe pool-param-set uuid=pool_uuid other-config:mail-destination=joe.bloggs@example.com
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com:<port>
<!--NeedCopy-->

XenServer configure automatiquement l’adresse de l’expéditeur en tant que noreply@<hostname>. Vous pouvez toutefois définir l’adresse de l’expéditeur de manière explicite :

xe pool-param-set uuid=pool_uuid other-config:mail-sender=serveralerts@example.com
<!--NeedCopy-->

Lorsque vous activez les notifications par e-mail, vous recevez une notification par e-mail lorsqu’une alerte avec une priorité de 3 ou plus est générée. Par conséquent, le niveau de priorité minimum par défaut est 3. Vous pouvez modifier cette valeur par défaut à l’aide de la commande suivante :

xe pool-param-set uuid=pool_uuid other-config:mail-min-priority=level
<!--NeedCopy-->

Remarque :

Certains serveurs SMTP transmettent uniquement les messages dont les adresses utilisent des noms de domaine complets. Si vous constatez que les e-mails ne sont pas transférés, c’est peut-être pour cette raison. Dans ce cas, vous pouvez définir le nom d’hôte du serveur sur le nom de domaine complet afin que cette adresse soit utilisée lors de la connexion à votre serveur de messagerie.

Pour configurer la langue des e-mails d’alerte de performance :

xe pool-param-set uuid=pool_uuid other-config:mail-language=ja-JP
<!--NeedCopy-->

La langue par défaut pour les e-mails d’alerte de performance est l’anglais.

Configuration supplémentaire

Pour configurer davantage l’utilitaire mail-alarm dans XenServer, créez un /etc/mail-alarm.conf fichier contenant les éléments suivants :

root=postmaster
authUser=<username>
authPass=<password>
mailhub=@MAILHUB@
<!--NeedCopy-->

/etc/mail-alarm.conf est un modèle fourni par l’utilisateur pour le fichier de configuration de SSmTP ssmtp.conf et est utilisé pour toutes les alertes générées par les hôtes XenServer. Il se compose de touches où key=@KEY@ et @KEY@ est remplacé par la valeur correspondante de ssmtp-key in pool.other_config. Ces valeurs sont ensuite transmises à ssmtp, ce qui vous permet de contrôler certains aspects de la configuration SSmtp à l’aide des valeurs de pool.other_config. Notez comment @KEY@ (majuscule) correspond à ssmtp-key (minuscule, préfixé par ssmtp-).

Par exemple, si vous configurez le serveur SMTP :

xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com
<!--NeedCopy-->

puis ajoutez ce qui suit à votre /etc/mail-alarm.conf fichier :

mailhub=@MAILHUB@
<!--NeedCopy-->

mailhub=@MAILHUB@ devient mailhub=smtp.example.com.

La configuration de chaque serveur SMTP peut légèrement différer et nécessiter une configuration supplémentaire. Pour configurer davantage SSmTP, modifiez son fichier de configuration ssmtp.conf. En stockant les clés pertinentes dans le fichier mail-alarm.conf, vous pouvez utiliser les valeurs pool.other_config pour configurer sSMTP. L’extrait suivant de la page de ssmtp.conf manuel présente la syntaxe correcte et les options disponibles :

NAME
    ssmtp.conf – ssmtp configuration file

DESCRIPTION
    ssmtp reads configuration data from /etc/ssmtp/ssmtp.conf The file con-
    tains keyword-argument pairs, one per line. Lines starting with '#'
    and empty lines are interpreted as comments.

The possible keywords and their meanings are as follows (both are case-
insensitive):

    Root
    The user that gets all mail for userids less than 1000. If blank,
    address rewriting is disabled.

    Mailhub
        The host to send mail to, in the form host | IP_addr port :
        <port>. The default port is 25.

    RewriteDomain
    The domain from which mail seems to come. For user authentication.

    Hostname
        The full qualified name of the host. If not specified, the host
        is queried for its hostname.

    FromLineOverride
        Specifies whether the From header of an email, if any, may over-
        ride the default domain. The default is "no".

    UseTLS
    Specifies whether ssmtp uses TLS to talk to the SMTP server.
    The default is "no".

    UseSTARTTLS
        Specifies whether ssmtp does a EHLO/STARTTLS before starting TLS
        negotiation. See RFC 2487.

    TLSCert
        The file name of an RSA certificate to use for TLS, if required.

    AuthUser
        The user name to use for SMTP AUTH. The default is blank, in
        which case SMTP AUTH is not used.

    AuthPass
        The password to use for SMTP AUTH.

    AuthMethod
        The authorization method to use. If unset, plain text is used.
        May also be set to "cram-md5".
<!--NeedCopy-->

Champs et balises personnalisés

XenCenter prend en charge la création de balises et de champs personnalisés, ce qui permet l’organisation et la recherche rapide des machines virtuelles, du stockage, etc. Pour plus d’informations, consultez la section Surveillance des performances du système.

Recherches personnalisées

XenCenter prend en charge la création de recherches personnalisées. Les recherches peuvent être exportées et importées, et les résultats d’une recherche peuvent être affichés dans le volet de navigation. Pour plus d’informations, consultez la section Surveillance des performances du système.

Déterminer le débit des adaptateurs de bus physiques

Pour les adaptateurs HBA FC, SAS et iSCSI, vous pouvez déterminer le débit réseau de vos PBD à l’aide de la procédure suivante.

  1. Répertoriez les PBD sur un hôte.
  2. Déterminez quels LUN sont routés sur quels PBD.
  3. Pour chaque PBD et SR, répertoriez les VBD qui font référence aux VDI sur le SR.
  4. Pour tous les VBD actifs attachés aux machines virtuelles de l’hôte, calculez le débit combiné.

Pour le stockage iSCSI et NFS, vérifiez vos statistiques réseau pour déterminer s’il existe un goulot d’étranglement de débit sur la baie ou si le PBD est saturé.

Surveillez les ressources de l’hôte et du dom0 avec NRPE

Remarque :

La fonctionnalité NRPE est disponible pour les clients de XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, voir Licences. Pour effectuer une mise à niveau ou acheter une licence XenServer, visitez le site Web de XenServer.

Les utilisateurs dotés du rôle d’administrateur du pool peuvent utiliser n’importe quel outil de surveillance tiers prenant en charge le Nagios Remote Plugin Executor (NRPE) pour surveiller les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte.

Vous pouvez utiliser les plugins de vérification suivants pour surveiller les ressources host et dom0 :

Métrique Nom de la vérification NRPE Description Seuil d’alerte par défaut Seuil critique par défaut Données de performance renvoyées
Charge du processeur hôte check_host_load Obtient et vérifie la charge actuelle par processeur physique de l’hôte, où la charge fait référence au nombre de processeurs virtuels en cours d’exécution ou exécutables. 3 4 Charge système actuelle du processeur de l’hôte (calculée en prenant la charge moyenne du processeur physique de l’hôte).
Utilisation du processeur hôte (%) check_host_cpu Obtient et vérifie l’utilisation globale actuelle du processeur de l’hôte. 80 % 90 % Le pourcentage du processeur hôte actuellement libre et le pourcentage utilisé.
Utilisation de la mémoire hôte (%) check_host_memory Obtient et vérifie l’utilisation actuelle de la mémoire par l’hôte. 80 % 90 % Le pourcentage de mémoire hôte actuellement libre et le pourcentage utilisé.
Utilisation du vGPU hôte (%) check_vgpu Obtient et vérifie toute l’utilisation actuelle du vGPU Nvidia en cours d’exécution sur l’hôte. 80 % 90 % Le pourcentage de vGPU en cours d’exécution qui est actuellement gratuit et le pourcentage utilisé.
Utilisation de la mémoire du vGPU hôte (%) check_vgpu_memory Obtient et vérifie toute l’utilisation actuelle de la mémoire Nvidia vGPU (y compris la mémoire partagée et la mémoire graphique) de l’hôte. 80 % 90 % Le pourcentage de mémoire vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) qui est actuellement libre et le pourcentage utilisé.
Charge du processeur Dom0 check_load Obtient et vérifie la charge moyenne actuelle du système par processeur de dom0, où la charge fait référence au nombre de processus en cours ou exécutables. 2.7, 2.6, 2.5 3.2, 3.1, 3 Les données de charge du processeur hôte sont calculées en prenant la moyenne des 1, 5 et 15 dernières minutes.
Utilisation du processeur Dom0 (%) check_cpu Obtient et vérifie l’utilisation globale actuelle du processeur de dom0. 80 % 90 % L’utilisation globale moyenne du processeur de dom0 en pourcentage.
Utilisation de la mémoire Dom0 (%) check_memory Obtient et vérifie l’utilisation actuelle de la mémoire de dom0. 80 % 90 % Le pourcentage de mémoire dom0 actuellement libre et le pourcentage utilisé.
Remplacement disponible Dom0 (%) check_swap Obtient et vérifie l’utilisation actuelle du swap de dom0. 20 % 10 % Le pourcentage de Mo actuellement gratuits sur dom0.
Espace libre de la partition racine Dom0 (%) check_disk_root Obtient et vérifie l’utilisation actuelle de la partition racine de dom0. 20 % 10 % Le pourcentage de Mo sur la partition racine dom0 qui est actuellement libre.
Espace libre sur la partition Dom0 Log (%) check_disk_log Obtient et vérifie l’utilisation actuelle de la partition de journal de dom0. 20 % 10 % Le pourcentage de Mo sur la partition de journal dom0 qui est actuellement libre.
État de la pile d’outils check_xapi Obtient et vérifie l’état de la pile d’outils de gestion XenServer (également appelée XAPI).     Le temps de disponibilité de XAPI s’est écoulé en quelques secondes.
État du multipath check_multipath Obtient et vérifie l’état des chemins de stockage.     État des chemins de stockage. OK indique que tous les chemins sont actifs, WARNING indique que certains chemins ont échoué mais que plusieurs chemins sont actifs, CRITICAL indique qu’il n’y a qu’un seul chemin actif ou que tous les chemins ont échoué, UNKNOWN indique que le multiacheminement des hôtes est désactivé et que l’état des chemins ne peut pas être récupéré.

NRPE est un service sur site qui s’exécute dans dom0 et écoute sur le port TCP (par défaut) 5666 les demandes d’exécution de contrôles provenant d’un outil de surveillance. Une fois qu’une demande est arrivée, NRPE l’analyse, trouve la commande de vérification correspondante, y compris les détails du paramètre, dans le fichier de configuration, puis l’exécute. Le résultat du contrôle est envoyé à l’outil de surveillance, qui enregistre les résultats des contrôles antérieurs et fournit un graphique présentant les données de performance historiques.

Logiciels requis

Pour pouvoir utiliser NRPE pour surveiller les ressources de l’hôte et du dom0, l’outil de surveillance que vous utilisez doit répondre aux prérequis suivants :

  • L’outil de surveillance doit être compatible avec la version 4.1.0 de NRPE.
  • Pour permettre la communication entre NRPE et l’outil de surveillance, l’outil de surveillance doit prendre en charge le protocole TLS 1.2 avec des chiffrements ECDHE-RSA-AES256-GCM-SHA384 et ECDHE-RSA-AES128-GCM-SHA256, et la courbe EC est secp384r1.

Contraintes

  • Vous pouvez configurer les paramètres NRPE pour un pool entier ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres NRPE pour un hôte individuel d’un pool.
  • Si vous ajoutez un hôte à un pool sur lequel NRPE est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres NRPE du pool au nouvel hôte. Vous devez reconfigurer les paramètres NRPE sur le pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres NRPE avant de l’ajouter au pool.

    Remarque :

    Lorsque vous reconfigurez les paramètres NRPE sur un pool après avoir ajouté un nouvel hôte, assurez-vous que l’hôte est opérationnel.

  • Si un hôte est supprimé d’un pool sur lequel le NRPE est activé et configuré, XenCenter ne modifie pas les paramètres NPRE de l’hôte ou du pool.

Configurer NRPE à l’aide de l’interface de ligne de commande xe

Vous pouvez configurer NRPE à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration de NRPE à l’aide de XenCenter, consultez la section Surveillance des ressources hôte etdom0 avec NRPE.

Après avoir modifié la configuration de NRPE, redémarrez le service NRPE à l’aide de :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->

Activer NRPE

NRPE est désactivé par défaut dans XenServer. Pour activer NRPE sur le domaine de contrôle d’un hôte (dom0), exécutez les commandes suivantes dans l’interface de ligne de commande xe :

  1. Obtenez l’UUID de l’hôte que vous souhaitez surveiller :

    xe host-list

  2. Activez NRPE sur l’hôte :

    xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable

    Si l’opération s’exécute correctement, cette commande est générée Success. Lorsque XenServer redémarre, NRPE démarre automatiquement.

Pour arrêter, démarrer, redémarrer ou désactiver NRPE :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->

l’opération est stop, start, restart, ou disable.

Serveurs de surveillance

Il s’agit d’une liste séparée par des virgules d’adresses IP ou de noms d’hôtes autorisés à communiquer avec le démon NRPE. Les adresses réseau comportant un masque de bits (par exemple 192.168.1.0/24) sont également prises en charge.

Consultez la liste actuelle des serveurs de surveillance :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->

Autorisez l’outil de surveillance à exécuter des contrôles :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->

Interrogez tous les paramètres NRPE :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->

Configurez plusieurs paramètres NRPE :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->

Journaux

Journalisation des déboguages

Par défaut, la journalisation du débogage est désactivée.

Pour vérifier si la journalisation du débogage est activée, exécutez la commande suivante :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->

Si debug: 0 est renvoyé, la journalisation du débogage est désactivée.

Pour activer la journalisation du débogage :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->
Journalisation SSL

Par défaut, la journalisation SSL est désactivée :

ssl_logging=0x00
<!--NeedCopy-->

Pour vérifier si la journalisation SSL est activée, exécutez la commande suivante :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->

Pour activer la journalisation SSL :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->

Seuils d’alerte et seuils critiques

Pour certains de ces plugins de vérification, vous pouvez définir des valeurs seuils d’avertissement et critiques de sorte que si la valeur renvoyée par un plug-in de vérification dépasse les valeurs seuils, une alerte soit générée. Le seuil d’alerte indique un problème potentiel et le seuil critique indique un problème plus grave qui nécessite une attention immédiate. Bien que les valeurs par défaut soient définies pour les seuils d’avertissement et les seuils critiques, vous pouvez ajuster les valeurs de seuil.

Pour interroger les valeurs d’avertissement et de seuil critique par défaut pour tous les contrôles, exécutez la commande xe CLI suivante qui renvoie une liste de tous les contrôles et leurs seuils d’avertissement et critiques associés :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->

Vous pouvez également rechercher les valeurs de seuil pour un contrôle spécifique. Par exemple, pour obtenir les valeurs d’avertissement et de seuil critiques pour le plug-in de vérification check_memory, exécutez la commande xe CLI suivante :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->

Vous pouvez également modifier la valeur par défaut d’un seuil. Par exemple, pour modifier les valeurs de seuil par défaut pour le plug-in de vérification check_memory, exécutez la commande xe CLI suivante :

xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->

Surveiller les ressources de l’hôte et du dom0 avec SNMP

Remarque :

La fonctionnalité SNMP est disponible pour les clients de XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, voir Licences. Pour effectuer une mise à niveau ou acheter une licence XenServer, visitez le site Web de XenServer.

Avec le rôle d’administrateur de pool, vous pouvez utiliser SNMP pour surveiller à distance les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte. Un gestionnaire SNMP, également appelé système de gestion réseau (NMS), envoie des demandes de requête à un agent SNMP exécuté sur un hôte XenServer. L’agent SNMP répond à ces requêtes en renvoyant les données collectées sur différentes mesures au NMS. Les données qui peuvent être collectées sont définies par des identificateurs d’objets (OID) dans un fichier texte appelé base d’informations de gestion (MIB). Un OID représente une information mesurable spécifique concernant un périphérique réseau, telle que l’utilisation du processeur ou de la mémoire.

Vous pouvez également configurer des traps, qui sont des messages initiés par l’agent qui alertent le NMS qu’un événement spécifique s’est produit sur XenServer. Les requêtes et les traps peuvent être utilisés pour surveiller l’état de vos pools XenServer. Ils sont définis comme des objets mesures et traps et sont identifiés par des OID dans un fichier MIB XENSERVER-MIB.txt, disponible au téléchargement depuis la page de téléchargements de XenServer. Les tableaux suivants fournissent des informations sur ces objets mesures et traps.

Objets mesures

Vous pouvez demander des informations spécifiques sur vos hôtes XenServer en utilisant les mesures répertoriées dans le tableau suivant. Ces mesures sont utilisées par le gestionnaire SNMP lors de l’envoi de requêtes à un agent SNMP. Vous pouvez ainsi consulter ces données dans votre NMS.

Vous pouvez consulter les données renvoyées par ces objets mesures depuis votre NMS ou depuis l’interface de ligne de commande xe. Pour interroger les objets mesures depuis l’interface de ligne de commande xe, exécutez host-data-source-query ou vm-data-source-query et fournissez la source de données RRDD comme valeur pour le paramètre data-source. Par exemple :

xe host-data-source-query data-source=cpu_avg host=<host UUID>
<!--NeedCopy-->

Remarque :

Par défaut, le NMS envoie des requêtes OID aux agents SNMP via le port 161.

Identifiant d’objet (OID) Source de données RRDD Données renvoyées Type
.1.3.6.1.4.1.60953.1.1.1.1 memory Mémoire totale Dom0 en Mo Unsigned32
.1.3.6.1.4.1.60953.1.1.1.2 memory_internal_free Dom0 mémoire libre en Mo Unsigned32
.1.3.6.1.4.1.60953.1.1.1.3 cpu_usage Utilisation du processeur Dom0 en pourcentage Flotteur
.1.3.6.1.4.1.60953.1.1.1.4 memory_total_kib Mémoire totale de l’hôte en Mo Unsigned32
.1.3.6.1.4.1.60953.1.1.1.5 memory_free_kib Mémoire libre de l’hôte en Mo Unsigned32
.1.3.6.1.4.1.60953.1.1.1.6 cpu_avg Utilisation du processeur hôte en pourcentage Flotteur
.1.3.6.1.4.1.60953.1.1.1.7 (voir note 1) Nombre de PCPUs Unsigned32
.1.3.6.1.4.1.60953.1.1.1.8 running_vcpus Numéro de vCPU en cours d’exécution Unsigned32
.1.3.6.1.4.1.60953.1.1.1.9 running_domains Numéro des machines virtuelles en cours d’exécution Unsigned32

Remarques :

  1. Le nom d’un pCPU est au format cpu suivi d’un chiffre. Pour interroger le nombre de PCPUs depuis l’interface de ligne de commande xe, exécutez la commande suivante :

    xe host-data-source-list host=<host UUID> | grep -E 'cpu[0-9]+$'

    This returns a list of the CPU metrics that match the regular expression cpu[0-9]+.

Traps

Les traps sont des alertes envoyées par l’agent SNMP pour avertir le gestionnaire SNMP lorsque certains événements se produisent, ce qui vous permet de surveiller vos hôtes XenServer et d’identifier les problèmes à un stade précoce. Vous pouvez configurer vos paramètres SNMP pour générer un trap lorsqu’une limite est atteinte (par exemple, si l’utilisation du processeur hôte est trop élevée). Lorsqu’un trap est généré, il est envoyé à votre NMS et les champs suivants sont renvoyés dans le cadre de l’objet trap.

Remarque :

Par défaut, l’agent SNMP de l’hôte du coordinateur de pool envoie des traps au NMS via le port UPD 162.

Identifiant d’objet (OID) Nom du champ Type Description
.1.3.6.1.4.1.60953.1.10.1.1 operation Chaîne Il peut s’agir de l’une des valeurs suivantes : add ou del. operation est add si un trap est généré par XenServer et envoyé à votre NMS (une alerte est également créée dans XenCenter) ou del si une alerte est détruite (par exemple, si vous rejetez une alerte).
.1.3.6.1.4.1.60953.1.10.1.2 ref Chaîne Référence de l’objet trap.
.1.3.6.1.4.1.60953.1.10.1.3 uuid Chaîne UUID de l’objet trap.
.1.3.6.1.4.1.60953.1.10.1.4 name Chaîne Nom de l’objet trap.
.1.3.6.1.4.1.60953.1.10.1.5 priority Entier Gravité du trap. Il peut s’agir de l’une des valeurs suivantes 1 : Critique, 2 : Majeur, 3 : Avertissement, 4 : Mineur, 5 : Informations, others : Inconnu.
.1.3.6.1.4.1.60953.1.10.1.6 class Chaîne Catégorie du trap généré. Il peut s’agir de l’une des valeurs suivantes : VM, Host, SR, Pool, VMPP, VMSS, PVS_proxy, VDI ou Certificate.
.1.3.6.1.4.1.60953.1.10.1.7 obj-uuid Chaîne L’UUID de l’objet xapi des différentes classes du champ class.
.1.3.6.1.4.1.60953.1.10.1.8 timestamp Chaîne Heure à laquelle le trap est généré.
.1.3.6.1.4.1.60953.1.10.1.9 body Chaîne Informations détaillées sur le domaine name.

Logiciels requis

  • Tous les hôtes d’un pool doivent exécuter la même version de XenServer et cette version doit contenir le plug-in SNMP.

    Remarque :

    Si vous ne pouvez pas voir l’onglet SNMP dans XenCenter, cela peut être dû au fait que l’hôte ou un membre du pool n’exécute pas de version de XenServer prenant en charge le SNMP. Mettez à jour l’hôte ou le pool vers la dernière version de XenServer.

  • Le NMS que vous utilisez doit prendre en charge SNMPv2c ou SNMPv3.

  • Votre NMS et XenServer doivent être connectés au réseau.

Contraintes

  • Vous pouvez configurer les paramètres SNMP pour l’ensemble d’un pool ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres SNMP pour un hôte individuel d’un pool.
  • Si vous ajoutez un hôte à un pool sur lequel SNMP est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres SNMP du pool au nouvel hôte. Vous devez reconfigurer les paramètres SNMP du pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres SNMP avant de l’ajouter au pool.

    Remarque :

    Lorsque vous reconfigurez les paramètres SNMP d’un pool après avoir ajouté un nouvel hôte, assurez-vous que l’hôte est opérationnel et qu’il n’est pas en mode de maintenance.

  • Avant d’effectuer une mise à niveau continue de Citrix Hypervisor 8.2 CU1 vers XenServer 8 ou d’appliquer des mises à jour à vos hôtes et pools XenServer, sauvegardez les fichiers de configuration suivants si vous les avez modifiés manuellement auparavant et si vous en avez besoin :

    • /etc/snmp/snmpd.xs.conf
    • /etc/sysconfig/snmp
    • /var/lib/net-snmp/snmpd.conf
  • Lorsque l’agent SNMP est hors ligne, aucun trap ne peut être généré. Par exemple, si l’agent SNMP est redémarré ou si le coordinateur du pool est redémarré ou redésigné.

Configurer SNMP à l’aide de l’interface de ligne de commande xe

Vous pouvez configurer SNMP à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration du SNMP à l’aide de XenCenter, consultez la section Surveillance des ressources de l’hôte etdu dom0 avec SNMP.

Objets result

Lors de la configuration de SNMP, toutes les réponses sont renvoyées au format JSON. Si une commande s’exécute correctement, elle renvoie la paire clé-valeur "code": 0. Certaines commandes (comme la commande get-config) renvoient un objet JSON imbriqué appelé result. L’objet JSON result est également requis pour la commande set-config utilisée pour mettre à jour la configuration SNMP.

L’objet JSON result est composé des objets suivants common, agent et nmss :

common

Champ Valeurs autorisées Valeur par défaut
enabled no (désactiver le service SNMP) ou yes (activer le service SNMP) no
debug_log no (désactiver la journalisation du débogage) ou yes (activer la journalisation du débogage) no
max_nmss N/A (Ce champ est en lecture seule et indique le nombre maximum de NMS pris en charge) 1

agent

Champ Valeurs autorisées Valeur par défaut
v2c no (désactiver SNMPv2C) ou yes (activer SNMPv2C) yes
community COMMON_STRING_TYPE (voir remarque 1) public
v3 no (désactiver la v3) ou yes (activer la v3) no
user_name COMMON_STRING_TYPE (voir remarque 1)  
authentication_password COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1)  
authentication_protocol MD5 ou SHA  
privacy_password COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1)  
privacy_protocol DES ou AES  
engine_id N/A (Ce champ est en lecture seule et est généré lorsque l’agent SNMP démarre pour la première fois)  

nmss

Champ Valeurs autorisées Valeur par défaut
uuid UUID NMS (vous le définissez lorsque vous configurez le récepteur de trap NMS et cette valeur doit être cohérente sur tous les hôtes d’un pool)  
address Adresse IPv4 ou nom d’hôte (FQDN) NMS  
port 1 à 65535 162
v2c no (désactivez SNMPv2C), yes (activez SNMPv2C), ou prenez en charge SNMPv2C ou v3. yes
community COMMON_STRING_TYPE (voir remarque 1) public
v3 no (désactivez la v3), yes (activez la version 3), ou prenez en charge SNMPv2C ou SNMPv3. no
user_name COMMON_STRING_TYPE (voir remarque 1)  
authentication_password COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1)  
authentication_protocol MD5 ou SHA  
privacy_password COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1)  
privacy_protocol DES ou AES  

Remarques :

  1. COMMON_STRING_TYPE fait référence à une chaîne qui répond aux exigences suivantes :
    • Toute combinaison de lettre, de chiffre, de tiret (-), de point (.), de livre (#), de signe arobase (@), de signe égal (=), de deux-points (:) ou de caractères de soulignement (_).
    • Longueur comprise entre 6 et 32 pouces inclus.
  2. Les mots de passe ne sont stockés en texte brut dans aucun fichier de configuration de XenServer. Elles sont converties en clé localisée et stockées. La commande get-config affiche le mot de passe sous la forme d’une constante cachée composée d’astérisques (*).

Configuration du service SNMP

Obtenez l’état du service SNMP :

xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=status
<!--NeedCopy-->

Démarrez, arrêtez ou redémarrez le service SNMP :

xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=<operation>
<!--NeedCopy-->

l’opération est start, stop ou restart.

Obtenez les détails de configuration SNMP :

xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=get-config
<!--NeedCopy-->

En cas de succès, cette commande renvoie la paire clé-valeur "code": 0 et l’objet JSON result contenant les détails de configuration du service SNMP. Par exemple :

"code": 0,
  "result": {
    "common": {
      "enabled": "no",
      "debug_log": "no",
      "max_nmss": 1
    },
    "agent": {
      "v2c": "yes",
      "v3": "no",
      "community": "public",
      "user_name": "",
      "authentication_password": "",
      "authentication_protocol": "",
      "privacy_password": "",
      "privacy_protocol": "",
      "engine_id": "<engine_id>"
    },
    "nmss": []
  }
<!--NeedCopy-->

Copiez l’objet JSON result dans votre éditeur de texte préféré et supprimez tous les caractères de nouvelle ligne (\n) du fichier. Mettez à jour les champs avec les détails de votre configuration SNMP. Configurez votre NMS en vous référant à la documentation de votre NMS et en spécifiant des valeurs pour les champs requis pour l’objet nmss. Pour plus d’informations, reportez-vous aux objets répertoriés ci-dessus.

Pour configurer le service SNMP, exécutez la commande set-config et fournissez l’objet JSON result modifié en tant que valeur de paramètre au paramètre args:config.

Définissez la configuration SNMP :

xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=set-config args:config='<result>'
<!--NeedCopy-->

result est l’objet JSON result renvoyé par la commande get-config que vous avez copiée et modifiée.

Remarque :

Pour configurer SNMP pour l’ensemble d’un pool, vous devez exécuter la commande set-config pour chaque hôte du pool.

Si les modifications de configuration sont réussies, la commande renvoie la paire clé-valeur "code": 0. Si les modifications de configuration échouent, la commande set-config renvoie l’une des paires clé-valeur suivantes, qui indiquent qu’une erreur s’est produite :

  • "code": 1 : chaîne d’erreur courante. Par exemple, une exception inconnue.
  • "code": 2 : chaîne d’erreur (le paramètre est manquant).
  • "code": 3 : renvoie un objet message sous la forme d’une liste où chaque élément est au format [field_path, key, value, error string].

Vous pouvez également envoyer un trap SNMP de test à votre NMS pour vérifier que les informations du récepteur de trap spécifiées sont correctes.

Envoyez un trap SNMP de test :

xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=send-test-trap args:config='{"nmss":[{"uuid":"<uuid>","address":"<address>","port":162,"v2c":"yes","v3":"no","community":"public","user_name":"<user_name>","authentication_password":"<authentication_password>","authentication_protocol":"<authentication_protocol>","privacy_password":"<privacy_password>","privacy_protocol":"<privacy_protocol>"}]}'
<!--NeedCopy-->

Cette commande envoie un trap de test à votre NMS avec le msg_name TEST_TRAP et le msg_body This is a test trap from XenServer pool "<pool name>" to verify the NMS Trap Receiver configuration..

Si vous ne recevez pas le trap de test, vérifiez à nouveau votre configuration SNMP. En cas d’échec, la commande send-test-trap renvoie également l’une des paires clé-valeur suivantes, qui indiquent qu’une erreur s’est produite :

  • "code": 1 : chaîne d’erreur courante. Par exemple, une exception inconnue.
  • "code": 2 : chaîne d’erreur (le paramètre est manquant).
  • "code": 3 : renvoie un objet message sous la forme d’une liste où chaque élément est au format [field_path, key, value, error string].
  • "code": 4 : renvoie un objet message sous la forme d’une liste où chaque élément est au format [nms address, nms port, error string].
Surveiller et gérer votre déploiement