Surveillez et gérez votre déploiement
XenServer fournit une surveillance détaillée des mesures de performance. Ces métriques incluent le processeur, la mémoire, le disque, le réseau, les informations d’état C/P et le stockage. Le cas échéant, ces métriques sont disponibles par hôte et par machine virtuelle. Ces métriques sont disponibles directement ou peuvent être consultées et affichées graphiquement dans XenCenter ou d’autres applications tierces.
XenServer fournit également des alertes système et de performances. Les alertes sont des notifications qui se produisent en réponse à des événements système sélectionnés. Ces notifications se produisent également lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle. Vous pouvez configurer les alertes à l’aide de l’interface de ligne de commande xe ou à l’aide de XenCenter. Pour créer des notifications basées sur l’une des métriques de performances de l’hôte ou de la machine virtuelle disponibles, reportez-vous à la section Alertes de performance.
Surveiller les performances de XenServer
Les clients peuvent surveiller les performances de leurs hôtes XenServer et de leurs machines virtuelles à l’aide des métriques exposées par les bases de données Round Robin (RRD). Ces métriques peuvent être interrogées via HTTP ou via l’outil RRD2CSV. En outre, XenCenter utilise ces données pour produire des graphiques de performances du système. Pour plus d’informations, consultez Analyser et visualiser les indicateurs.
Les tableaux suivants répertorient toutes les métriques d’hôte et de machine virtuelle disponibles.
Remarques :
- La latence sur une période est définie comme la latence moyenne des opérations au cours de cette période.
- La disponibilité et l’utilité de certaines métriques dépendent de la SR et du CPU.
Métriques d’hôte disponibles
Nom de la métrique | Description | Condition | Nom XenCenter |
---|---|---|---|
avgqu_sz_<sr-uuid-short> |
Taille moyenne de la file d’attente d’E/S (demandes). | Au moins un VBD branché dans SR <sr-uuid-short> sur l’hôte |
sr-uuid-short Taille de la file d’attente |
cpu<cpu>-C<cstate> |
Temps CPU CPU dépensé en état C cstate en millisecondes. |
L’état C existe sur le processeur | CPU CPU État C cstate
|
cpu<cpu>-P<pstate> |
Temps CPU CPU dépensé dans l’État P pstate en millisecondes. |
L’état P existe sur le processeur | CPU CPU État P pstate
|
cpu<cpu> |
Utilisation du processeur physique CPU (fraction). Activé par défaut. |
CPU CPU Existe |
CPU CPU
|
cpu_avg |
Utilisation moyenne des processeurs physiques (fraction). Activé par défaut. | Aucun | Processeur moyen |
hostload |
Charge de l’hôte par processeur physique, où la charge fait référence au nombre de vCPU en cours d’exécution ou exécutables. | Aucun | Charge du processeur de l’hôte |
inflight_<sr-uuid-short> |
Nombre de demandes d’E/S actuellement en cours. Activé par défaut. | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Demandes en vol |
io_throughput_read_<sr-uuidshort> |
Données lues à partir de SR (Mio/s). | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Débit de lecture |
io_throughput_write_<sr-uuidshort> |
Données écrites dans le SR (Mio/s). | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Débit d’écriture |
io_throughput_total_<sr-uuidshort> |
Toutes les E/S SR (MiB/s). | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Débit total |
iops_read_<sr-uuid-short> |
Demandes de lecture par seconde. | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr IOPS en lecture |
iops_write_<sr-uuid-short> |
Demandes d’écriture par seconde. | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Etape par seconde |
iops_total_<sr-uuid-short> |
Demandes d’E/S par seconde. | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Nombre total d’IOPS |
iowait_<sr-uuid-short> |
Pourcentage du temps d’attente des E/S. | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr IO Wait |
latency_<sr-uuid-short> |
Latence d’E/S moyenne (millisecondes). | Au moins un VBD branché dans SR Sr sur l’hôte |
Sr Latence |
loadavg |
Moyenne de charge Domain0. Activée par défaut | Aucun | Contrôler la charge du domaine |
memory_free_kib |
Quantité totale de mémoire libre (KiO). Activé par défaut. | Aucun | Non présent dans XenCenter. Remplacée par la mémoire utilisée. |
Non signalé par la pile d’outils. Calculé par XenCenter. | Quantité totale de mémoire utilisée (KiO). Activé par défaut. | Aucun | Mémoire utilisée |
memory_reclaimed |
Mémoire de l’hôte récupérée par squeeze (B). | Aucun | Mémoire récupérée |
memory_reclaimed_max |
Mémoire hôte disponible pour la récupération avec squeeze (B). | Aucun | Mémoire potentiellement récupérée |
memory_total_kib |
Quantité totale de mémoire (KiO) dans l’hôte. Activé par défaut. | Aucun | Mémoire totale |
network/latency |
Intervalle en secondes entre les deux derniers pulsations transmises de l’hôte local à tous les hôtes en ligne. Désactivé par défaut. | HA activé | Latence du réseau |
statefile/<vdi_uuid>/latency |
Délai d’exécution en secondes du dernier accès au fichier d’état à partir de l’hôte local. Désactivé par défaut. | HA activé | Latence des fichiers d’état HA |
pif_<pif>_rx |
Octets par seconde reçus sur l’interface physique Pif . Activé par défaut. |
Le PIF existe |
XenCenter-pifname Recevoir (voir note) |
pif_<pif>_tx |
Octets par seconde envoyés sur l’interface physique Pif . Activé par défaut. |
Le PIF existe |
XenCenter-pifname Envoyer (voir note) |
pif_<pif>_rx_errors |
Réception d’erreurs par seconde sur l’interface physique Pif . Désactivé par défaut. |
Le PIF existe |
XenCenter-pifname Erreurs de réception (voir note) |
pif_<pif>_tx_errors |
Erreurs de transmission par seconde sur l’interface physique Pif . Désactivé par défaut |
Le PIF existe |
XenCenter-pifname Envoyer des erreurs (voir note) |
pif_aggr_rx |
Octets par seconde reçus sur toutes les interfaces physiques. Activé par défaut. | Aucun | Réception totale de la carte réseau |
pif_aggr_tx |
Octets par seconde envoyés sur toutes les interfaces physiques. Activé par défaut. | Aucun | Envoi total de la carte réseau |
pvsaccelerator_evicted |
Octets par seconde supprimés du cache | PVSAccelerator activé | Taux d’éviction de PVS-Accelerator |
pvsaccelerator_read_hits |
Lectures par seconde servies à partir du cache | PVSAccelerator activé | Taux de réussite de l’accélérateur PVS |
pvsaccelerator_read_misses |
Lectures par seconde qui ne peuvent pas être servies à partir du cache | PVSAccelerator activé | Taux d’échec de l’accélérateur PVS |
pvsaccelerator_traffic_client_sent |
Octets par seconde envoyés par les clients PVS mis en cache | PVSAccelerator activé | PVS-Accelerator a observé le trafic réseau des clients |
pvsaccelerator_traffic_server_sent |
Octets par seconde envoyés par les serveurs PVS mis en cache | PVSAccelerator activé | PVS-Accelerator a observé le trafic réseau des serveurs |
pvsaccelerator_read_total |
Lectures par seconde observées par le cache | PVSAccelerator activé | Taux de lecture observé de l’accélérateur PVS |
pvsaccelerator_traffic_proxy_saved |
Octets par seconde envoyés par PVSAccelerator au lieu du serveur PVS | PVSAccelerator activé | PVS-Accelerator a économisé le trafic réseau |
pvsaccelerator_space_utilization |
Pourcentage d’espace utilisé par PVSAccelerator sur cet hôte, par rapport à la taille totale du stockage du cache | PVSAccelerator activé | Utilisation de l’espace de l’accélérateur PVS |
running_vcpus |
Le nombre total de vCPU en cours d’exécution | Aucun | Nombre de vCPU en cours d’exécution |
running_domains |
Le nombre total de domaines en cours d’exécution, y compris dom0 (le domaine de contrôle de l’hôte) | Aucun | Nombre de domaines en cours d’exécution |
sr_<sr>_cache_size |
Taille en octets de l’IntelliCache SR. Activé par défaut. | IntelliCache activé | Taille du cache IntelliCache |
sr_<sr>_cache_hits |
Accès au cache par seconde. Activé par défaut. | IntelliCache activé | Accès au cache IntelliCache |
sr_<sr>_cache_misses |
Échecs de cache par seconde. Activé par défaut. | IntelliCache activé | Échecs du cache IntelliCache |
xapi_allocation_kib |
Allocation de mémoire (KiO) effectuée par le démon XAPI. Activé par défaut. | Aucun | Allocation de mémoire de l’agent |
xapi_free_memory_kib |
Mémoire libre (KiO) disponible pour le démon XAPI. Activé par défaut. | Aucun | Mémoire de l’agent libre |
xapi_healthcheck/latency |
Délai d’exécution en secondes du dernier appel de surveillance de l’état XAPI sur l’hôte local. Désactivé par défaut. | Haute disponibilité activée | Latence de haute disponibilité de XenServer |
xapi_live_memory_kib |
Mémoire en direct (KiO) utilisée par le démon XAPI. Activé par défaut. | Aucun | Mémoire de l’agent en direct |
xapi_memory_usage_kib |
Mémoire totale (KiO) allouée utilisée par le démon XAPI. Activé par défaut. | Aucun | Utilisation de la mémoire de l’agent |
Métriques de machine virtuelle disponibles
Nom de la métrique | Description | Condition | Nom XenCenter |
---|---|---|---|
cpu<cpu> |
Utilisation du vCPU CPU (fraction). Activée par défaut |
Processeur virtuel CPU Existe |
UC |
cpu_usage |
Utilisation du processeur du domaine | Aucun | cpu_usage |
memory |
Mémoire actuellement allouée à la machine virtuelle (octets). Activé par défaut | Aucun | Mémoire totale |
memory_target |
Cible du pilote de bulle de machine virtuelle (octets). Activée par défaut | Aucun | Cible de mémoire |
memory_internal_free |
Mémoire utilisée telle que signalée par l’agent invité (KiB). Activée par défaut | Aucun | Mémoire libre |
runstate_fullrun |
Fraction de temps pendant laquelle tous les vCPU s’exécutent. | Aucun | Exécution complète des vCPUs |
runstate_full_contention |
Fraction de temps pendant laquelle tous les vCPU sont exécutables (c’est-à-dire en attente du CPU) | Aucun | contention complète des vCPU |
runstate_concurrency_hazard |
Fraction de temps pendant laquelle certains vCPU s’exécutent et d’autres peuvent être exécutés | Aucun | Risque d’accès concurrentiel des vCPU |
runstate_blocked |
Fraction de temps pendant laquelle tous les vCPU sont bloqués ou hors ligne | Aucun | vCPU inactifs |
runstate_partial_run |
Fraction de temps pendant laquelle certains vCPU s’exécutent et d’autres sont bloqués | Aucun | Exécution partielle des vCPU |
runstate_partial_contention |
Fraction de temps pendant laquelle certains vCPU peuvent être exécutés et d’autres sont bloqués | Aucun | contention partielle des vCPU |
vbd_<vbd>_write |
Écriture sur le périphérique vbd en octets par seconde. Activée par défaut |
VBD vbd Existe |
Disque vbd Écrire |
vbd_<vbd>_read |
Lits à partir de l’appareil vbd en octets par seconde. Activé par défaut. |
VBD vbd Existe |
Disque vbd Lire |
vbd_<vbd>_write_latency |
Écriture sur le périphérique vbd en quelques microsecondes. |
VBD vbd Existe |
Disque vbd Latence d’écriture |
vbd_<vbd>_read_latency |
Lits à partir de l’appareil vbd en quelques microsecondes. |
VBD vbd Existe |
Disque vbd Latence de lecture |
vbd <vbd>_iops_read |
Demandes de lecture par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd Lire les IOPS |
vbd <vbd>_iops_write |
Demandes d’écriture par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd Etape par seconde |
vbd <vbd>_iops_total |
Demandes d’E/S par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd Nombre total d’IOPS |
vbd <vbd>_iowait |
Pourcentage de temps d’attente de I/0. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd IO Wait |
vbd <vbd>_inflight |
Nombre de demandes d’E/S actuellement en cours. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd Demandes en vol |
vbd <vbd>_avgqu_sz |
Taille moyenne de la file d’attente d’E/S. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disque vbd Taille de la file d’attente |
vif_<vif>_rx |
Octets par seconde reçus sur le numéro d’interface virtuelle VIF . Activé par défaut. |
VIF VIF Existe |
VIF Recevoir |
vif_<vif>_tx |
Octets par seconde transmis sur l’interface virtuelle VIF . Activé par défaut. |
VIF VIF Existe |
VIF Envoyer |
vif_<vif>_rx_errors |
Réception d’erreurs par seconde sur l’interface virtuelle VIF . Activé par défaut. |
VIF VIF Existe |
VIF Erreurs de réception |
vif_<vif>_tx_errors |
Erreurs de transmission par seconde sur l’interface virtuelle VIF Activé par défaut. |
VIF VIF Existe |
VIF Envoyer des erreurs |
Remarque :
La valeur de
<XenCenter-pif-name>
Il peut s’agir de l’un des éléments suivants :
NIC <pif>
-si<pif>
Contientpif_eth#
où##
est compris entre 0 et 9<pif>
-si<pif>
Contientpif_eth#. ##
oupif_xenbr##
oupif_bond##
<Internal> Réseau <pif>
-si<pif>
Contientpif_xapi##
, (notez que<Internal>
apparaît tel quel)ROBINET <tap>
-si<pif>
Contientpif_tap##
Bouclage xapi
-si<pif>
Contientpif_lo
Analyser et visualiser les indicateurs
L’onglet Performances de XenCenter fournit une surveillance en temps réel des statistiques de performances dans les pools de ressources, en plus des tendances graphiques des performances des machines virtuelles et physiques. Par défaut, les graphiques montrant les E/S du processeur, de la mémoire, du réseau et du disque sont inclus dans l’onglet Performances. Vous pouvez ajouter d’autres indicateurs, modifier l’apparence des graphiques existants ou en créer d’autres. Pour plus d’informations, consultez Configuration des métriques dans la section suivante.
-
Vous pouvez afficher jusqu’à 12 mois de données de performance et zoomer pour examiner de plus près les pics d’activité.
-
XenCenter peut générer des alertes de performances lorsque l’utilisation du processeur, de la mémoire, des E/S réseau, des E/S de stockage ou des E/S de disque dépasse un seuil spécifié sur un hôte, une machine virtuelle ou un SR. Pour plus d’informations, consultez Alertes dans la section suivante.
Remarque :
Installez les outils de machine virtuelle XenServer pour afficher les données complètes de performance de la machine virtuelle.
Configurer les graphiques de performances
Pour ajouter un graphique :
-
Sur le Performance , cliquez sur Actions Et puis Nouveau graphique. La boîte de dialogue Nouveau graphique s’affiche.
-
Dans le Nom , entrez un nom pour le graphique.
-
Dans la liste des Sources de données, cochez les cases des sources de données que vous souhaitez inclure dans le graphique.
-
Cliquez sur Enregistrer.
Pour modifier un graphique existant :
-
Accédez à l’icône Performance et sélectionnez le graphique que vous souhaitez modifier.
-
Faites un clic droit sur le graphique et sélectionnez Actions, ou cliquez sur l’icône Actions bouton. Sélectionnez ensuite Modifier le graphique.
-
Dans la fenêtre des détails du graphique, apportez les modifications nécessaires, puis cliquez sur D’ACCORD.
Configurer le type de graphique
Les données sur les graphiques de performance peuvent être affichées sous forme de lignes ou de zones. Pour modifier le type de graphique :
-
Sur le Outils menu, cliquez sur Options et sélectionnez Graphiques.
-
Pour afficher les données de performances sous forme de graphique linéaire, cliquez sur l’icône Graphique linéaire option.
-
Pour afficher les données de performances sous forme d’graphique en aires, cliquez sur l’icône Graphique en aires option.
-
Cliquez sur OK pour enregistrer vos modifications.
Vous trouverez des détails complets sur la configuration et l’affichage des graphiques de performances XenCenter dans la documentation XenCenter dans la section Surveillance des performances du système.
Configurer les mesures
Remarque :
Les états C et P sont des fonctionnalités de gestion de l’alimentation de certains processeurs. La plage d’états disponibles dépend des capacités physiques de l’hôte, ainsi que de la configuration de la gestion de l’alimentation.
Les commandes host et VM renvoient les éléments suivants :
-
Une description complète de la source de données
-
Les unités appliquées à la métrique
-
La plage de valeurs possibles qui peuvent être utilisées
Par exemple :
name_label: cpu0-C1
name_description: Proportion of time CPU 0 spent in C-state 1
enabled: true
standard: true
min: 0.000
max: 1.000
units: Percent
<!--NeedCopy-->
Activer une métrique spécifique
La plupart des métriques sont activées et collectées par défaut, pour activer les métriques qui ne le sont pas, entrez ce qui suit :
xe host-data-source-record data-source=metric name host=hostname
<!--NeedCopy-->
Désactiver une métrique spécifique
Il se peut que vous ne souhaitiez pas collecter certaines statistiques régulièrement. Pour désactiver une mesure précédemment activée, entrez ce qui suit :
xe host-data-source-forget data-source=metric name host=hostname
<!--NeedCopy-->
Affichage d’une liste des métriques d’hôte actuellement activées
Pour répertorier les métriques d’hôte actuellement collectées, entrez ce qui suit :
xe host-data-source-list host=hostname
<!--NeedCopy-->
Afficher la liste des métriques de machine virtuelle actuellement activées
Pour héberger les métriques de machine virtuelle actuellement collectées, entrez ce qui suit :
xe vm-data-source-list vm=vm_name
<!--NeedCopy-->
Utiliser les DRR
XenServer utilise les RRD pour stocker les métriques de performance. Ces DRR se composent de plusieurs archives à la ronde (ARR) dans une base de données de taille fixe.
Chaque archive de la base de données échantillonne sa métrique particulière sur une granularité spécifiée :
- Toutes les 5 secondes pendant 10 minutes
- Chaque minute au cours des deux dernières heures
- Toutes les heures de la semaine écoulée
- Tous les jours de l’année écoulée
L’échantillonnage qui a lieu toutes les cinq secondes enregistre les points de données réels, mais les RRA suivants utilisent des fonctions de consolidation à la place. Les fonctions de consolidation prises en charge par XenServer sont les suivantes :
- MOYENNE
- MIN
- MAX
Les RRD existent pour les machines virtuelles individuelles (y compris dom0) et l’hôte XenServer. Les RRD de machine virtuelle sont stockés sur l’hôte sur lequel ils s’exécutent, ou sur le coordinateur de pool lorsqu’ils ne sont pas en cours d’exécution. Par conséquent, l’emplacement d’une machine virtuelle doit être connu pour récupérer les données de performances associées.
Pour plus d’informations sur l’utilisation des RRD XenServer, consultez la section Guide du kit de développement logiciel XenServer.
Analyser les RRD à l’aide de HTTP
Vous pouvez télécharger des RRD via HTTP à partir de l’hôte XenServer spécifié à l’aide du gestionnaire HTTP enregistré à l’adresse /host_rrd
ou /vm_rrd
. Les deux adresses nécessitent une authentification soit par authentification HTTP, soit en fournissant des références de session d’API de gestion valides en tant qu’argument de requête. Par exemple :
Téléchargez un RRD hôte.
wget http://server/host_rrd?session_id=OpaqueRef:SESSION HANDLE>
<!--NeedCopy-->
Téléchargez un RRD de machine virtuelle.
wget http://server/vm_rrd?session_id=OpaqueRef:SESSION HANDLE>&uuid=VM UUID>
<!--NeedCopy-->
Ces deux appels téléchargent XML dans un format qui peut être analysé directement.
Analyser les RRD à l’aide de rrd2csv
En plus d’afficher les mesures de performances dans XenCenter, l’outil rrd2csv consigne les RRD au format CSV (Comma Separated Value). Des pages d’homme et d’aide sont fournies. Pour afficher l’outil man de rrd2csv ou les pages d’aide, exécutez la commande suivante :
man rrd2csv
<!--NeedCopy-->
Ou
rrd2csv --help
<!--NeedCopy-->
Remarque :
Lorsque plusieurs options sont utilisées, fournissez-les individuellement. Par exemple : pour renvoyer à la fois l’UUID et le nom associé à une machine virtuelle ou à un hôte, appelez rrd2csv comme indiqué ci-dessous :
rrd2csv -u -n
L’UUID renvoyé est unique et convient en tant que clé primaire, mais le nom d’une entité n’est pas nécessairement unique.
La page de manuel (rrd2csv --help
) est le texte d’aide définitif de l’outil.
Alertes
Vous pouvez configurer XenServer pour générer des alertes en fonction de l’une des métriques d’hôte ou de machine virtuelle disponibles. En outre, XenServer fournit des alertes préconfigurées qui se déclenchent lorsque les hôtes sont soumis à certaines conditions et états. Vous pouvez afficher ces alertes à l’aide de XenCenter ou de l’interface de ligne de commande xe.
Afficher les alertes à l’aide de XenCenter
Vous pouvez afficher différents types d’alertes dans XenCenter en cliquant sur Notifications Et puis Alertes. Le Alertes affiche différents types d’alertes, notamment les alertes de performances, les alertes système, les alertes de mise à jour logicielle, les alertes de licence et les alertes de groupe anti-affinité de machine virtuelle. Pour plus d’informations, consultez Alertes.
Alertes de performance
Des alertes de performances peuvent être générées lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage (SR) : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle.
Par défaut, l’intervalle de répétition de l’alerte est fixé à 60 minutes, il peut être modifié si nécessaire. Les alertes sont affichées sur la page Alertes de la zone Notifications de XenCenter. Vous pouvez également configurer XenCenter pour qu’il envoie un e-mail pour toutes les alertes de performances spécifiées ainsi que d’autres alertes système sérieuses.
Toutes les alertes personnalisées configurées à l’aide de l’interface de ligne de commande xe sont également affichées sur la page Alertes de XenCenter.
Chaque alerte a un niveau de priorité/gravité correspondant. Vous pouvez modifier ces niveaux et choisir éventuellement de recevoir un email lorsque l’alerte est déclenchée. La priorité/gravité de l’alerte par défaut est définie sur 3
.
Priority | Nom | Description | Alerte e-mail par défaut |
---|---|---|---|
1 | Critique | Agissez maintenant, sinon les données risquent d’être perdues/corrompues de façon permanente. | Oui |
2 | Major | Agissez maintenant ou certains services risquent d’échouer. | Oui |
3 | Avertissement | Agissez maintenant ou un service peut en souffrir. | Oui |
4 | Mineur | Remarquez que quelque chose vient de s’améliorer. | Non |
5 | Information | Informations quotidiennes (VM Start, Stop, Reprise, etc.) | Non |
? | Inconnu | Erreur inconnue | Non |
Configurer les alertes de performances
-
Dans le Ressources , sélectionnez l’hôte, la machine virtuelle ou le SR approprié, puis cliquez sur l’icône Généralités , puis Propriétés.
-
Sélectionnez l’icône Alertes onglet. Le tableau suivant récapitule les alertes disponibles pour les hôtes, les machines virtuelles ou les SR :
Nom de l’alerte Hôte VM SR Description Générer des alertes d’utilisation du processeur X X Définissez l’utilisation du processeur et le seuil de temps qui déclenchent l’alerte. Générer des alertes d’utilisation du processeur du domaine de contrôle X Définissez l’utilisation du processeur du domaine de contrôle et le seuil de temps qui déclenchent l’alerte. Générer des alertes d’utilisation de la mémoire X Définissez l’utilisation de la mémoire et le seuil de temps qui déclenchent l’alerte. Générer des alertes d’utilisation de la mémoire du domaine de contrôle X Définissez le domaine de contrôle, l’utilisation de la mémoire et le seuil de temps qui déclenchent l’alerte. Générer des alertes de mémoire libre de domaine de contrôle X Définissez le seuil de mémoire libre et de temps du domaine de contrôle qui déclenche l’alerte. Générer des alertes d’utilisation du disque X Définissez l’utilisation du disque et le seuil de temps pour déclencher l’alerte. Générer des alertes de débit de stockage X Définissez le débit de stockage et le seuil de temps qui déclenchent l’alerte. Remarque : Les périphériques de blocs physiques (PBD) représentent l’interface entre un hôte XenServer spécifique et un SR attaché. Lorsque l’activité totale de débit SR en lecture/écriture sur un PBD dépasse le seuil que vous avez spécifié, des alertes sont générées sur l’hôte connecté au PBD. Contrairement aux autres alertes d’hôte XenServer, cette alerte doit être configurée sur le SR. Générer des alertes d’utilisation du réseau X X Définissez l’utilisation du réseau et le seuil de temps qui déclenchent l’alerte. Pour modifier l’intervalle de répétition de l’alerte, entrez le nombre de minutes dans le Intervalle de répétition de l’alerte boîte. Lorsqu’un seuil d’alerte a été atteint et qu’une alerte a été générée, une autre alerte n’est générée qu’après l’expiration de l’intervalle de répétition de l’alerte.
-
Cliquez sur OK pour enregistrer vos modifications.
Pour plus d’informations sur l’affichage, le filtrage et la configuration des niveaux de gravité des alertes de performances, consultez la section Configuration des alertes de performances dans la documentation XenCenter.
Alertes système
Le tableau suivant affiche les événements/conditions système qui déclenchent l’affichage d’une alerte sur la page Alertes de XenCenter.
Nom | Priorité/Gravité | Description |
---|---|---|
license_expires_soon | 2 | Le contrat de licence XenServer expire bientôt. |
ha-statefile_lost | 2 | Perdu le contact avec le Storage Repository haute disponibilité, agissez vite. |
ha-heartbeat_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer à moins qu’une action ne soit entreprise. |
ha_statefile_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer à moins qu’une action ne soit entreprise. |
haxapi_healthcheck_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer à moins qu’une action ne soit entreprise. |
ha_network_bonding_error | 3 | Perte de service potentielle. Perte du réseau qui envoie une pulsation à haute disponibilité. |
ha_pool_overcommited | 3 | Perte de service potentielle. La haute disponibilité n’est pas en mesure de garantir la protection des machines virtuelles configurées. |
ha_poor_drop_in_plan_exists_for | 3 | La couverture haute disponibilité a diminué, plus susceptible de tomber en panne, aucune perte n’est encore présente. |
ha_protected_vm_restart_failed | 2 | Perte de service. La haute disponibilité n’a pas pu redémarrer une machine virtuelle protégée. |
ha_host_failed | 3 | La haute disponibilité a détecté la défaillance d’un hôte. |
ha_host_was_fenced | 4 | La haute disponibilité a redémarré un hôte pour le protéger contre l’altération de la machine virtuelle. |
redo_log_healthy | 4 | Le journal de rétablissement XAPI a été récupéré à partir d’une erreur précédente. |
redo_log_broken | 3 | Le journal de rétablissement XAPI a rencontré une erreur. |
ip_configured_pif_can_unplug | 3 | Une carte réseau configurée IP peut être débranchée par XAPI lors de l’utilisation de la haute disponibilité, ce qui peut entraîner une défaillance de la haute disponibilité. |
host_sync_data_failed | 3 | Échec de la synchronisation des statistiques de performances de XenServer. |
host_clock_skew_detected | 3 | L’horloge de l’hôte n’est pas synchronisée avec celle des autres hôtes du pool. |
host_clock_went_backwards | 1 | L’horloge de l’hôte est corrompue. |
pool_master_transition | 4 | Un nouvel hôte a été spécifié comme coordinateur de pool. |
pbd_plug_failed_on_server_start | 3 | L’hôte n’a pas réussi à se connecter au stockage au moment du démarrage. |
auth_external_init_failed | 2 | L’hôte n’a pas réussi à activer l’authentification AD externe. |
auth_external_pool_non-homogène | 2 | Les hôtes d’un pool ont une configuration d’authentification AD différente. |
multipath_period_alert | 3 | Un chemin d’accès à une SR a échoué ou s’est rétabli. |
bond-status-changed | 3 | Un lien d’une liaison s’est déconnecté ou reconnecté. |
Alertes de mise à jour logicielle
- XenCenter ancien : XenServer attend une version plus récente mais peut toujours se connecter à la version actuelle
- XenCenter obsolète : XenCenter est trop ancien pour se connecter à XenServer
- XenServer obsolète : XenServer est une ancienne version à laquelle le XenCenter actuel ne peut pas se connecter
- Alerte de licence expirée : La licence XenServer a expiré
- Alerte IQN manquante : XenServer utilise le stockage iSCSI mais l’IQN de l’hôte est vide
- Alerte IQN en double : XenServer utilise le stockage iSCSI et il existe des IQN d’hôte en double
Configurer les alertes de performances à l’aide de l’interface de ligne de commande xe
Remarque :
Les déclencheurs d’alertes sont vérifiés à un intervalle minimum de cinq minutes. Cet intervalle évite d’imposer une charge excessive au système pour vérifier ces conditions et de signaler les faux positifs. La définition d’un intervalle de répétition d’alerte inférieur à cinq minutes entraîne la génération des alertes à l’intervalle minimum de cinq minutes.
Le suivi de la performance perfmon
s’exécute une fois toutes les cinq minutes et demande des mises à jour à XenServer qui sont en moyenne sur une minute. Ces valeurs par défaut peuvent être modifiées dans /etc/sysconfig/perfmon
.
Le perfmon
L’outil lit les mises à jour toutes les cinq minutes des variables de performance exécutées sur le même hôte. Ces variables sont séparées en un groupe relatif à l’hôte lui-même et un groupe pour chaque machine virtuelle exécutée sur cet hôte. Pour chaque machine virtuelle et hôte, perfmon
lit le paramètre other-config :perfmon
et utilise cette chaîne pour déterminer les variables à surveiller et les circonstances dans lesquelles générer un message.
Par exemple, voici un exemple de configuration d’une alerte « Utilisation du processeur » de machine virtuelle en écrivant une chaîne XML dans le paramètre other-config :perfmon
:
xe vm-param-set uuid=vm_uuid other-config:perfmon=\
'<config>
<variable>
<name value="cpu_usage"/>
<alarm_trigger_level value="0.5"/>
</variable>
</config>'
<!--NeedCopy-->
Remarque :
Vous pouvez utiliser plusieurs nœuds variables.
Après avoir défini la nouvelle configuration, utilisez la commande suivante pour actualiser perfmon
Pour chaque hôte :
xe host-call-plugin host=host_uuid plugin=perfmon fn=refresh
<!--NeedCopy-->
Si cette actualisation n’est pas effectuée, il y a un délai avant que la nouvelle configuration ne prenne effet, car par défaut, perfmon
vérifie la présence d’une nouvelle configuration toutes les 30 minutes. Cette valeur par défaut peut être modifiée dans /etc/sysconfig/perfmon
.
Éléments de machine virtuelle valides
-
nom
: Le nom de la variable (pas de valeur par défaut). Si la valeur du nom est soitcpu_usage
,network_usage
oudisk_usage
lerrd_regex
etalarm_trigger_sense
Les paramètres ne sont pas obligatoires, car les valeurs par défaut sont utilisées. -
alarm_priority
: La priorité des alertes générées (par défaut3
). -
alarm_trigger_level
: Le niveau de valeur qui déclenche une alerte (pas de valeur par défaut). -
alarm_trigger_sense
: La valeur esthaut
sialarm_trigger_level
est une valeur maximale sinonbas
si lealarm_trigger_level
est une valeur minimale (la valeur par défauthaut
). -
alarm_trigger_period
: Le nombre de secondes pendant lesquelles les valeurs (supérieures ou inférieures au seuil d’alerte) peuvent être reçues avant l’envoi d’une alerte (la valeur par défaut est60
). -
alarm_auto_inhibit_period
: Le nombre de secondes pendant lesquelles cette alerte sera désactivée après l’envoi d’une alerte (la valeur par défaut est3600
). -
consolidation_fn
: Combine les variables de rrd_updates en une seule valeur. PourUtilisation du processeur
La valeur par défaut estmoyenne
pourfs_usage
La valeur par défaut estget_percent_fs_usage
et pour tous les autres -somme
. -
rrd_regex
: Correspond aux noms des variables dexe vm-data-sources-list uuid=vm_uuid
, pour calculer les valeurs de performance. Ce paramètre a des valeurs par défaut pour les variables nommées :- cpu_usage
- memory_internal_free
- network_usage
- disk_usage
Si elle est spécifiée, les valeurs de tous les éléments renvoyées par xe vm-data-source-list
dont les noms correspondent à l’expression régulière spécifiée sont consolidés à l’aide de la méthode spécifiée consolidation_fn
.
Éléments d’hôte valides
-
nom
: Le nom de la variable (pas de valeur par défaut). -
alarm_priority
: La priorité des alertes générées (par défaut3
). -
alarm_trigger_level
: Le niveau de valeur qui déclenche une alerte (pas de valeur par défaut). -
alarm_trigger_sense
: La valeur esthaut
quandalarm_trigger_level
est une valeur maximale sinonbas
si lealarm_trigger_level
est une valeur minimale. (par défauthaut
) -
alarm_trigger_period
: Le nombre de secondes pendant lesquelles les valeurs (supérieures ou inférieures au seuil d’alerte) peuvent être reçues avant l’envoi d’une alerte (par défaut60
). -
alarm_auto_inhibit_period
: nombre de secondes pendant lesquelles l’alerte est désactivée après l’envoi d’une alerte. (par défaut3600
). -
consolidation_fn
: Combine les variables derrd_updates
en une seule valeur (par défautsomme
-oumoyenne
) -
rrd_regex
: A regular expression to match the names of variables returned by thexe vm-data-source-list uuid=vm_uuid
command to use to compute the statistical value. This parameter has defaults for the following named variables:- cpu_usage
- network_usage
- memory_free_kib
- sr_io_throughput_total_xxxxxxxx (où
xxxxxxxx
est les huit premiers caractères du SR-UUID).
Débit SR: Les alertes de débit de stockage doivent être configurées sur le SR plutôt que sur l’hôte. Par exemple :
xe sr-param-set uuid=sr_uuid other-config:perfmon=\
'<config>
<variable>
<name value="sr_io_throughput_total_per_host"/>
<alarm_trigger_level value="0.01"/>
</variable>
</config>'
<!--NeedCopy-->
Exemple de configuration générique
L’exemple suivant illustre une configuration générique :
<config>
<variable>
<name value="NAME_CHOSEN_BY_USER"/>
<alarm_trigger_level value="THRESHOLD_LEVEL_FOR_ALERT"/>
<alarm_trigger_period value="RAISE_ALERT_AFTER_THIS_MANY_SECONDS_OF_BAD_VALUES"/>
<alarm_priority value="PRIORITY_LEVEL"/>
<alarm_trigger_sense value="HIGH_OR_LOW"/>
<alarm_auto_inhibit_period value="MINIMUM_TIME_BETWEEN_ALERT_FROM_THIS_MONITOR"/>
<consolidation_fn value="FUNCTION_FOR_COMBINING_VALUES"/>
<rrd_regex value="REGULAR_EXPRESSION_TO_CHOOSE_DATASOURCE_METRIC"/>
</variable>
<variable>
...
</variable>
...
</config>
<!--NeedCopy-->
Configurer les alertes par e-mail
Vous pouvez configurer XenServer pour qu’il envoie des notifications par e-mail lorsque les hôtes XenServer génèrent des alertes. L’utilitaire d’alarme de messagerie de XenServer utilise sSMTP pour envoyer ces notifications par e-mail. Vous pouvez activer les alertes par e-mail de base à l’aide de XenCenter ou de l’interface de ligne de commande (CLI) xe. Pour une configuration plus poussée des alertes par e-mail, vous pouvez modifier l’icône mail-alarm.conf
fichier de configuration.
Utilisez un serveur SMTP qui ne nécessite pas d’authentification. Les e-mails envoyés via des serveurs SMTP qui nécessitent une authentification ne peuvent pas être distribués.
Activer les alertes par e-mail à l’aide de XenCenter
-
Dans le
Ressources
, cliquez avec le bouton droit de la souris sur un pool et sélectionnezPropriétés
. -
Dans le
Propriétés
fenêtre, sélectionnezOptions de courriel
. -
Sélectionnez l’icône
Envoyer des notifications d’alerte par e-mail
case à cocher. Entrez votre adresse de destination préférée pour les e-mails de notification et les détails du serveur SMTP. -
Choisissez votre langue préférée dans le
Langue du courrier
liste. La langue par défaut des e-mails d’alerte de performance est l’anglais.
Activer les alertes par e-mail à l’aide de l’interface de ligne de commande xe
Pour configurer les alertes par e-mail, spécifiez votre adresse de destination préférée pour les e-mails de notification et le serveur SMTP :
xe pool-param-set uuid=pool_uuid other-config:mail-destination=joe.bloggs@example.com
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com:<port>
<!--NeedCopy-->
XenServer configure automatiquement l’adresse de l’expéditeur comme suit : noreply@<hostname>
. Toutefois, vous pouvez définir l’adresse de l’expéditeur explicitement :
xe pool-param-set uuid=pool_uuid other-config:mail-sender=serveralerts@example.com
<!--NeedCopy-->
Lorsque vous activez les notifications par e-mail, vous recevez une notification par e-mail lorsqu’une alerte de priorité de 3 ou plus est générée. Par conséquent, le niveau de priorité minimum par défaut est 3
. Vous pouvez modifier cette valeur par défaut à l’aide de la commande suivante :
xe pool-param-set uuid=pool_uuid other-config:mail-min-priority=level
<!--NeedCopy-->
Remarque :
Certains serveurs SMTP ne transfèrent que les e-mails dont les adresses utilisent des noms de domaine complets. Si vous constatez que les e-mails ne sont pas transférés, c’est peut-être pour cette raison. Dans ce cas, vous pouvez définir le nom d’hôte du serveur sur le nom de domaine complet afin que cette adresse soit utilisée lors de la connexion à votre serveur de messagerie.
Pour configurer la langue des e-mails d’alerte de performance :
xe pool-param-set uuid=pool_uuid other-config:mail-language=ja-JP
<!--NeedCopy-->
La langue par défaut des e-mails d’alerte de performance est l’anglais.
Configuration supplémentaire
Pour configurer davantage l’utilitaire d’alarme de messagerie dans XenServer, créez un /etc/mail-alarm.conf
contenant les éléments suivants :
root=postmaster
authUser=<username>
authPass=<password>
mailhub=@MAILHUB@
<!--NeedCopy-->
/etc/mail-alarm.conf
est un modèle fourni par l’utilisateur pour le fichier de configuration de sSMTP ssmtp.conf
et est utilisé pour toutes les alertes générées par les hôtes XenServer. Il se compose de touches où clé=@KEY@
et @KEY@
est remplacée par la valeur correspondante de Clé-ssmtp
dans pool.other_config
. Ces valeurs sont ensuite transmises à ssmtp, ce qui vous permet de contrôler certains aspects de la configuration sSMTP à l’aide des valeurs de pool.other_config
. Notez comment @KEY@
(majuscule) correspond à Clé-ssmtp
(minuscule, préfixé par SSMTP-
).
Par exemple, si vous définissez le serveur SMTP :
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com
<!--NeedCopy-->
puis ajoutez ce qui suit à votre /etc/mail-alarm.conf
lime:
mailhub=@MAILHUB@
<!--NeedCopy-->
mailhub=@MAILHUB@
Devient mailhub=smtp.example.com
.
Chaque serveur SMTP peut différer légèrement dans sa configuration et peut nécessiter une configuration supplémentaire. Pour configurer davantage sSMTP, modifiez son fichier de configuration ssmtp.conf
. En stockant les clés pertinentes dans le mail-alarm.conf
fichier, vous pouvez utiliser les valeurs dans pool.other_config
pour configurer sSMTP. L’extrait suivant de la ssmtp.conf
La page de manuel affiche la syntaxe correcte et les options disponibles :
NAME
ssmtp.conf – ssmtp configuration file
DESCRIPTION
ssmtp reads configuration data from /etc/ssmtp/ssmtp.conf The file con-
tains keyword-argument pairs, one per line. Lines starting with '#'
and empty lines are interpreted as comments.
The possible keywords and their meanings are as follows (both are case-
insensitive):
Root
The user that gets all mail for userids less than 1000. If blank,
address rewriting is disabled.
Mailhub
The host to send mail to, in the form host | IP_addr port :
<port>. The default port is 25.
RewriteDomain
The domain from which mail seems to come. For user authentication.
Hostname
The full qualified name of the host. If not specified, the host
is queried for its hostname.
FromLineOverride
Specifies whether the From header of an email, if any, may over-
ride the default domain. The default is "no".
UseTLS
Specifies whether ssmtp uses TLS to talk to the SMTP server.
The default is "no".
UseSTARTTLS
Specifies whether ssmtp does a EHLO/STARTTLS before starting TLS
negotiation. See RFC 2487.
TLSCert
The file name of an RSA certificate to use for TLS, if required.
AuthUser
The user name to use for SMTP AUTH. The default is blank, in
which case SMTP AUTH is not used.
AuthPass
The password to use for SMTP AUTH.
AuthMethod
The authorization method to use. If unset, plain text is used.
May also be set to "cram-md5".
<!--NeedCopy-->
Champs et balises personnalisés
XenCenter prend en charge la création de balises et de champs personnalisés, ce qui permet l’organisation et la recherche rapide de machines virtuelles, de stockage, etc. Pour plus d’informations, consultez Surveillance des performances du système.
Recherches personnalisées
XenCenter prend en charge la création de recherches personnalisées. Les recherches peuvent être exportées et importées, et les résultats d’une recherche peuvent être affichés dans le volet de navigation. Pour plus d’informations, consultez Surveillance des performances du système.
Déterminer le débit des adaptateurs de bus physiques
Pour les adaptateurs HBA FC, SAS et iSCSI, vous pouvez déterminer le débit réseau de vos PBD à l’aide de la procédure suivante.
- Répertoriez les PBD sur un hôte.
- Déterminez quelles LUN sont acheminées sur quels PBD.
- Pour chaque PBD et SR, répertoriez les VBD qui font référence à des VDI sur le SR.
- Pour tous les VBD actifs qui sont attachés aux machines virtuelles sur l’hôte, calculez le débit combiné.
Pour le stockage iSCSI et NFS, vérifiez les statistiques de votre réseau pour déterminer s’il existe un goulot d’étranglement du débit au niveau de la baie ou si le PBD est saturé.
Surveillez les ressources host et dom0 avec NRPE
Remarque :
La fonctionnalité NRPE est disponible pour les clients XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, consultez Licences. Pour mettre à niveau ou pour obtenir une licence XenServer, rendez-vous sur le Site web de XenServer.
Les utilisateurs disposant du rôle Pool Admin peuvent utiliser n’importe quel outil de surveillance tiers prenant en charge le Nagios Remote Plugin Executor (NRPE) pour surveiller les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte.
Vous pouvez utiliser les plugins de vérification suivants pour surveiller les ressources host et dom0 :
Métrique | Nom de la vérification NRPE | Description | Seuil d’avertissement par défaut | Seuil critique par défaut | Données de performance renvoyées |
---|---|---|---|---|---|
Charge du processeur de l’hôte | check_host_load | Obtient et vérifie la charge actuelle par processeur physique de l’hôte, où la charge fait référence au nombre de vCPU en cours d’exécution ou exécutables. | 3 | 4 | Charge système actuelle du processeur de l’hôte (calculée en prenant la charge moyenne du processeur physique de l’hôte). |
Utilisation du processeur de l’hôte (%) | check_host_cpu | Obtient et vérifie l’utilisation moyenne actuelle du processeur global de l’hôte. | 80 % | 90 % | Pourcentage de CPU hôte actuellement libre et pourcentage utilisé. |
Utilisation de la mémoire de l’hôte (%) | check_host_memory | Obtient et vérifie l’utilisation actuelle de la mémoire de l’hôte. | 80 % | 90 % | Pourcentage de la mémoire hôte actuellement disponible et pourcentage utilisé. |
Utilisation du vGPU de l’hôte (%) | check_vgpu | Obtient et vérifie toute l’utilisation actuelle de Nvidia vGPU de l’hôte. | 80 % | 90 % | Pourcentage de vGPU en cours d’exécution actuellement libre et pourcentage utilisé. |
Utilisation de la mémoire vGPU de l’hôte (%) | check_vgpu_memory | Obtient et vérifie toute l’utilisation actuelle de la mémoire Nvidia vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) de l’hôte. | 80 % | 90 % | Pourcentage de mémoire vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) actuellement disponible et pourcentage utilisé. |
Charge CPU Dom0 | check_load | Obtient et vérifie la charge moyenne actuelle du système par processeur de dom0, où la charge fait référence au nombre de processus dans un état en cours d’exécution ou exécutable. | 2.7,2.6,2.5 | 3.2,3.1,3 | Les données de charge du processeur de l’hôte sont calculées en prenant la moyenne des 1, 5 et 15 dernières minutes. |
Utilisation du processeur Dom0 (%) | check_cpu | Obtient et vérifie l’utilisation moyenne actuelle du processeur global de dom0. | 80 % | 90 % | Utilisation globale moyenne du processeur de dom0 en pourcentage. |
Utilisation de la mémoire dom0 (%) | check_memory | Obtient et vérifie l’utilisation actuelle de la mémoire de dom0. | 80 % | 90 % | Pourcentage de mémoire dom0 actuellement libre et pourcentage utilisé. |
Dom0 Échange gratuit (%) | check_swap | Obtient et vérifie l’utilisation actuelle de l’échange dom0. | 20% | 10 % | Le pourcentage de Mo sur dom0 qui est actuellement libre. |
Dom0 Partition racine Espace libre (%) | check_disk_root | Obtient et vérifie l’utilisation actuelle de la partition racine de dom0. | 20% | 10 % | Pourcentage de Mo sur la partition racine dom0 qui est actuellement libre. |
Dom0 Log Partition Espace libre (%) | check_disk_log | Obtient et vérifie l’utilisation actuelle de la partition de journal de dom0. | 20% | 10 % | Pourcentage de Mo sur la partition de journal dom0 qui est actuellement libre. |
État de la pile d’outils | check_xapi | Obtient et vérifie l’état de la pile d’outils de gestion XenServer (également appelée XAPI). | Le temps de fonctionnement écoulé de XAPI en secondes. | ||
État des chemins d’accès multiples | check_multipath | Obtient et vérifie l’état des chemins de stockage. | L’état des chemins de stockage. D’ACCORD indique que tous les chemins sont actifs, AVERTISSEMENT indique que certains chemins ont échoué mais que plusieurs chemins sont actifs, CRITIQUE indique qu’il n’y a qu’un seul chemin actif ou que tous les chemins ont échoué, INCONNU indique que le multipathing de l’hôte est désactivé et que l’état des chemins d’accès ne peut pas être récupéré. |
NRPE est un service sur site qui s’exécute dans dom0 et écoute sur le port TCP (par défaut) 5666 pour les demandes d’exécution de vérification à partir d’un outil de surveillance. Une fois qu’une demande est arrivée, NRPE l’analyse, trouve la commande check correspondante, y compris les détails du paramètre dans le fichier de configuration, puis l’exécute. Le résultat de la vérification est envoyé à l’outil de surveillance, qui stocke les résultats des vérifications précédentes et fournit un graphique montrant les données de performances historiques.
Prérequis
Pour pouvoir utiliser NRPE pour surveiller les ressources host et dom0, l’outil de supervision que vous utilisez doit répondre aux prérequis suivants :
- L’outil de surveillance doit être compatible avec la version 4.1.0 du NRPE.
- Pour permettre la communication entre le NRPE et l’outil de surveillance, celui-ci doit prendre en charge TLS 1.2 avec les chiffrements
ECDHE-RSA-AES256-GCM-SHA384
etECDHE-RSA-AES128-GCM-SHA256
, et la courbe EC estSECP384R1
.
Contraintes
- Vous pouvez configurer les paramètres NRPE pour l’ensemble d’un pool ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres NRPE pour un hôte individuel dans un pool.
-
Si vous ajoutez un hôte à un pool sur lequel NRPE est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres NRPE du pool au nouvel hôte. Vous devez reconfigurer les paramètres NRPE sur le pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres NRPE avant de l’ajouter au pool.
Remarque :
Lorsque vous reconfigurez les paramètres NRPE sur un pool après l’ajout d’un nouvel hôte, assurez-vous que l’hôte est opérationnel.
- Si un hôte est supprimé d’un pool sur lequel NRPE est activé et configuré, XenCenter ne modifie pas les paramètres NPRE sur l’hôte ou le pool.
Configurer NRPE à l’aide de l’interface de ligne de commande xe
Vous pouvez configurer NRPE à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration de NRPE à l’aide de XenCenter, consultez Surveillance des ressources host et dom0 avec NRPE.
Après avoir apporté des modifications de configuration à NRPE, redémarrez le service NRPE à l’aide de :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->
Activer NRPE
NRPE est désactivé par défaut dans XenServer. Pour activer NRPE sur le domaine de contrôle d’un hôte (dom0), exécutez les commandes suivantes dans l’interface de ligne de commande xe :
-
Obtenez l’UUID de l’hôte que vous souhaitez surveiller :
xe host-list
-
Activez NRPE sur l’hôte :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable
Si l’opération s’exécute correctement, cette commande génère
Succès
. Lorsque XenServer redémarre, NRPE démarre automatiquement.
Pour arrêter, démarrer, redémarrer ou désactiver NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->
où opération est arrêter
, commencer
, redémarrer
ou désactiver
.
Surveillance des serveurs
Il s’agit d’une liste d’adresses IP ou de noms d’hôte séparés par des virgules qui sont autorisés à communiquer avec le démon NRPE. Adresses réseau avec un masque de bits (par exemple 192.168.1.0/24
) sont également pris en charge.
Consultez la liste actuelle des serveurs de surveillance :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->
Autorisez l’outil de surveillance à exécuter des vérifications :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->
Interrogez tous les paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->
Configurez plusieurs paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->
Journaux
Journalisation de débogage
Par défaut, la journalisation de débogage est désactivée.
Pour vérifier si la journalisation de débogage est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->
Si débogage : 0
est renvoyé, la journalisation de débogage est désactivée.
Pour activer la journalisation de débogage :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->
Journalisation SSL
Par défaut, la journalisation SSL est désactivée :
ssl_logging=0x00
<!--NeedCopy-->
Pour vérifier si la journalisation SSL est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->
Pour activer la journalisation SSL :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->
Seuils d’alerte et seuils critiques
Pour certains de ces plug-ins de vérification, vous pouvez définir des valeurs de seuil d’avertissement et de critique de sorte que si la valeur renvoyée par un plug-in de vérification dépasse les valeurs de seuil, une alerte est générée. Le seuil d’avertissement indique un problème potentiel et le seuil critique indique un problème plus grave qui nécessite une attention immédiate. Bien que des valeurs par défaut soient définies pour les seuils d’avertissement et critique, vous pouvez ajuster les valeurs de seuil.
Pour interroger les valeurs d’avertissement et de seuil critique par défaut pour toutes les vérifications, exécutez la commande CLI xe suivante qui renvoie une liste de toutes les vérifications et de leurs seuils d’avertissement et critiques associés :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->
Vous pouvez également interroger les valeurs de seuil d’une vérification spécifique. Par exemple, pour obtenir les valeurs d’avertissement et de seuil critique pour le check_memory
check plugin, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->
Vous pouvez également modifier la valeur par défaut d’un seuil. Par exemple, pour modifier les valeurs de seuil par défaut de la commande check_memory
check plugin, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->
Surveiller les ressources host et dom0 avec SNMP
Remarque :
La fonctionnalité SNMP est disponible pour les clients XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, consultez Licences. Pour mettre à niveau ou pour obtenir une licence XenServer, rendez-vous sur le Site web de XenServer.
Avec le rôle Admin de pool, vous pouvez utiliser SNMP pour surveiller à distance les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte. Un gestionnaire SNMP, également appelé système de gestion de réseau (NMS), envoie des requêtes à un agent SNMP s’exécutant sur un hôte XenServer. L’agent SNMP répond à ces demandes de requête en renvoyant les données collectées sur diverses métriques au NMS. Les données qui peuvent être collectées sont définies par des identificateurs d’objet (OID) dans un fichier texte appelé base d’informations de gestion (MIB). Un OID représente un élément spécifique d’informations mesurables sur un périphérique réseau, tel que l’utilisation du processeur ou de la mémoire.
Vous pouvez également configurer des interruptions, qui sont des messages initiés par l’agent qui alertent le NMS qu’un événement spécifique s’est produit dans XenServer. Les requêtes et les interruptions peuvent être utilisées pour surveiller l’état de vos pools XenServer. Ceux-ci sont définis comme des objets de mesure et d’interruption et sont identifiés par des OID dans un fichier MIB XENSERVER-MIB.txt
, disponible en téléchargement à partir du Page de téléchargements de XenServer. Les tableaux suivants fournissent des informations sur ces objets de mesure et d’interruption.
Objets métriques
Vous pouvez demander une information spécifique sur vos hôtes XenServer à l’aide des métriques répertoriées dans le tableau suivant. Ces métriques sont utilisées par le gestionnaire SNMP lors de l’envoi de demandes de requête à un agent SNMP et vous permettent donc d’afficher ces données dans votre NMS.
Vous pouvez afficher les données renvoyées à partir de ces objets de mesure à partir de votre NMS ou de l’interface de ligne de commande xe. Pour interroger les objets de mesure à partir de l’interface de ligne de commande xe, exécutez requête-source-de-données-hôte
ou vm-data-source-query
et fournir la source de données RRDD comme valeur pour le source_de-données
paramètre. Par exemple :
xe host-data-source-query data-source=cpu_avg host=<host UUID>
<!--NeedCopy-->
Remarque :
Par défaut, le NMS envoie des demandes de requête OID aux agents SNMP à l’aide du port 161.
Identificateur d’objet (OID) | Source de données RRDD | Données renvoyées | Type |
---|---|---|---|
.1.3.6.1.4.1.60953.1.1.1.1 | memory |
Mémoire totale Dom0 en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.2 | memory_internal_free |
Mémoire libre Dom0 en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.3 | cpu_usage |
Utilisation du processeur Dom0 en pourcentage | Flotter |
.1.3.6.1.4.1.60953.1.1.1.4 | memory_total_kib |
Mémoire totale de l’hôte en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.5 | memory_free_kib |
Mémoire libre de l’hôte en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.6 | cpu_avg |
Utilisation du processeur de l’hôte en pourcentage | Flotter |
.1.3.6.1.4.1.60953.1.1.1.7 | (voir note 1) | Nombre de pCPU | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.8 | running_vcpus |
Nombre de vCPU en cours d’exécution | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.9 | running_domains |
Nombre de machines virtuelles en cours d’exécution | Unsigned32 |
Remarques :
Le nom d’un pCPU est au format
CPU
suivi d’un chiffre. Pour interroger le nombre de pCPU à partir de l’interface de ligne de commande xe, exécutez la commande suivante :
xe host-data-source-list host=<host UUID> | grep -E 'cpu[0-9]+$'
Cela renvoie une liste des métriques de processeur qui correspondent à l’expression régulière
Processeur[0-9]+
.
Pièges
Les interruptions sont des alertes envoyées par l’agent SNMP pour informer le gestionnaire SNMP lorsque certains événements se produisent, ce qui vous permet de surveiller vos hôtes XenServer et d’identifier les problèmes à un stade précoce. Vous pouvez configurer vos paramètres SNMP pour générer une interruption lorsqu’une limite est atteinte (par exemple, si l’utilisation du processeur de l’hôte est trop élevée). Lorsqu’une interruption est générée, elle est envoyée à votre NMS et les champs suivants sont renvoyés dans le cadre de l’objet d’interruption.
Remarque :
Par défaut, l’agent SNMP sur l’hôte du coordinateur de pool envoie des interruptions au NMS à l’aide du port UPD 162.
Identificateur d’objet (OID) | Nom du champ | Type | Description |
---|---|---|---|
.1.3.6.1.4.1.60953.1.10.1.1 | operation |
Chaîne | Il peut s’agir de l’une des valeurs suivantes : ajouter ou Del . opération est ajouter si un piège est généré par XenServer et envoyé à votre NMS (une alerte est également créée dans XenCenter) ou Del si une alerte est détruite (par exemple, si vous ignorez une alerte). |
.1.3.6.1.4.1.60953.1.10.1.2 | ref |
Chaîne | Référence de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.3 | uuid |
Chaîne | UUID de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.4 | name |
Chaîne | Nom de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.5 | priority |
Entier | La gravité du piège. Il peut s’agir de l’une des valeurs suivantes : 1 :Critique 2 :Majeur 3 :Avertissement 4 :Mineur 5 :Information autrui :Inconnu. |
.1.3.6.1.4.1.60953.1.10.1.6 | class |
Chaîne | La catégorie du piège généré. Il peut s’agir de l’une des valeurs suivantes : VM , Hôte , SR , Mare , VMPP , VMSS , PVS_proxy , VDI ou Certificat . |
.1.3.6.1.4.1.60953.1.10.1.7 | obj-uuid |
Chaîne | L’UUID de l’objet xapi des différentes classes du champ classe . |
.1.3.6.1.4.1.60953.1.10.1.8 | timestamp |
Chaîne | Heure à laquelle l’interruption est générée. |
.1.3.6.1.4.1.60953.1.10.1.9 | body |
Chaîne | Informations détaillées sur le terrain nom . |
Prérequis
-
Tous les hôtes d’un pool doivent exécuter la même version de XenServer et cette version doit contenir le plugin SNMP.
Remarque :
Si vous ne voyez pas l’icône SNMP dans XenCenter, cela peut être dû au fait que l’hôte ou un membre du pool n’exécute pas une version de XenServer qui prend en charge SNMP. Mettez à jour l’hôte ou le pool vers la dernière version de XenServer.
-
Le NMS que vous utilisez doit prendre en charge SNMPv2c ou SNMPv3.
-
Votre NMS et XenServer doivent être connectés au réseau.
Contraintes
- Vous pouvez configurer les paramètres SNMP pour l’ensemble d’un pool ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres SNMP pour un hôte individuel dans un pool.
-
Si vous ajoutez un hôte à un pool sur lequel SNMP est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres SNMP du pool au nouvel hôte. Vous devez reconfigurer les paramètres SNMP sur le pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres SNMP avant de l’ajouter au pool.
Remarque :
Lors de la reconfiguration des paramètres SNMP sur un pool après l’ajout d’un nouvel hôte, assurez-vous que l’hôte est opérationnel et qu’il n’est pas en mode de maintenance.
-
Avant d’effectuer une mise à niveau propagée du pool Citrix Hypervisor 8.2 CU1 vers XenServer 8 ou d’appliquer des mises à jour à vos hôtes et pools XenServer, sauvegardez les fichiers de configuration suivants si vous les avez modifiés manuellement auparavant et que vous en avez besoin :
/etc/snmp/snmpd.xs.conf
/etc/sysconfig/snmp
/var/lib/net-snmp/snmpd.conf
- Lorsque l’agent SNMP est hors ligne, les interruptions ne peuvent pas être générées. Par exemple, si l’agent SNMP est redémarré ou si le coordinateur de pool est redémarré ou redésigné.
Configurer SNMP à l’aide de l’interface de ligne de commande xe
Vous pouvez configurer SNMP à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration de SNMP à l’aide de XenCenter, consultez Surveillance des ressources host et dom0 avec SNMP.
résultat
Objets
Lors de la configuration de SNMP, toutes les réponses sont renvoyées au format JSON. Si une commande s’exécute correctement, elle renvoie la paire clé-valeur « code » : 0
. Certaines commandes (telles que le get-config
) renvoie un objet JSON imbriqué appelé résultat
. Le résultat
JSON est également requis pour l’objet set-config
qui permet de mettre à jour la configuration SNMP.
Le résultat
L’objet JSON est composé des objets suivants commun
, agent
et Le
:
common
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
enabled |
Non (désactiver le service SNMP) ou oui (activer le service SNMP) |
no |
debug_log |
Non (désactiver la journalisation de débogage) ou oui (activer la journalisation de débogage) |
no |
max_nmss |
N/A (ce champ est en lecture seule et spécifie le nombre maximal de NMS pris en charge) | 1 |
agent
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
v2c |
Non (désactiver SNMPv2c) ou oui (activer SNMPv2c) |
yes |
community |
COMMON_STRING_TYPE (voir note 1) | public |
v3 |
Non (désactiver v3) ou oui (activer la v3) |
no |
user_name |
COMMON_STRING_TYPE (voir note 1) | |
authentication_password |
COMMON_STRING_TYPE où longueur >= 8 (voir note 1) | |
authentication_protocol |
MD5 ou SHA
|
|
privacy_password |
COMMON_STRING_TYPE où longueur >= 8 (voir note 1) | |
privacy_protocol |
DES ou AES
|
|
engine_id |
N/A (ce champ est en lecture seule et est généré lors du premier démarrage de l’agent SNMP) |
nmss
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
uuid |
UUID NMS (vous définissez cette valeur lorsque vous configurez le récepteur d’interruption NMS et cette valeur doit être cohérente sur tous les hôtes d’un pool) | |
address |
Adresse IPv4 NMS ou nom d’hôte (FQDN) | |
port |
1 À 65535
|
162 |
v2c |
Non (désactiver SNMPv2c), oui (activez SNMPv2c) ou prenez en charge SNMPv2c ou v3. |
yes |
community |
COMMON_STRING_TYPE (voir note 1) | public |
v3 |
Non (désactiver v3), oui (activer la v3) ou prendre en charge SNMPv2c ou SNMPv3. |
no |
user_name |
COMMON_STRING_TYPE (voir note 1) | |
authentication_password |
COMMON_STRING_TYPE où longueur >= 8 (voir note 1) | |
authentication_protocol |
MD5 ou SHA
|
|
privacy_password |
COMMON_STRING_TYPE où longueur >= 8 (voir note 1) | |
privacy_protocol |
DES ou AES
|
Remarques :
COMMON_STRING_TYPE fait référence à une chaîne qui répond aux exigences suivantes :
- Toute combinaison de lettres, de chiffres, de traits d’union (-), de points (), de dièse (#), de signe arobase (@), d’égal à (=), de deux-points (:) ou de traits de soulignement (_).
- Longueur entre 6 et 32 inclus.
Les mots de passe ne sont pas stockés en texte brut dans un fichier de configuration de XenServer. Ils sont convertis en une clé localisée et stockés. Le
get-config
affiche le mot de passe sous la forme d’une constante cachée composée d’astérisques (*).
Configurer le service SNMP
Obtenez l’état du service SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=status
<!--NeedCopy-->
Démarrer, arrêter ou redémarrer le service SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=<operation>
<!--NeedCopy-->
où opération est commencer
, arrêter
ou redémarrer
.
Obtenez les détails de la configuration SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=get-config
<!--NeedCopy-->
En cas de réussite, cette commande renvoie la paire clé-valeur « code » : 0
et le résultat
Objet JSON contenant les détails de configuration du service SNMP. Par exemple :
"code": 0,
"result": {
"common": {
"enabled": "no",
"debug_log": "no",
"max_nmss": 1
},
"agent": {
"v2c": "yes",
"v3": "no",
"community": "public",
"user_name": "",
"authentication_password": "",
"authentication_protocol": "",
"privacy_password": "",
"privacy_protocol": "",
"engine_id": "<engine_id>"
},
"nmss": []
}
<!--NeedCopy-->
Copiez le résultat
JSON à l’éditeur de texte de votre choix et supprimez tous les sauts de ligne (\n) du fichier. Mettez à jour les champs avec les détails de votre configuration SNMP. Configurez votre SGEN en vous référant à la documentation de votre SGEN et en spécifiant des valeurs pour les champs requis pour le Le
objet. Pour plus d’informations, reportez-vous à la Objets énumérées ci-dessus.
Pour configurer le service SNMP, exécutez la commande set-config
et fournissez la commande résultat
JSON en tant que valeur de paramètre args :config
paramètre.
Définissez la configuration SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=set-config args:config='<result>'
<!--NeedCopy-->
où résultat est le résultat
JSON renvoyé par l’objet get-config
que vous avez copiée et modifiée.
Remarque :
Pour configurer SNMP pour l’ensemble d’un pool, vous devez exécuter la commande
set-config
pour chaque hôte du pool.
Si les modifications de configuration réussissent, la commande renvoie la paire clé-valeur « code » : 0
. Si les modifications de configuration échouent, le set-config
Renvoie l’une des paires clé-valeur suivantes qui indiquent qu’une erreur s’est produite :
-
« code » : 1
: Chaîne d’erreur courante. Par exemple, une exception inconnue. -
« code » : 2
: Chaîne d’erreur (paramètre manquant). -
« code » : 3
: Renvoie unMessage
objet sous la forme d’une liste où chaque élément est au format[field_path, clé, valeur, chaîne d’erreur]
.
Vous pouvez également envoyer une interruption SNMP de test à votre NMS pour vérifier que les informations du récepteur d’interruption spécifiées sont correctes.
Envoyez une interruption SNMP de test :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=send-test-trap args:config='{"nmss":[{"uuid":"<uuid>","address":"<address>","port":162,"v2c":"yes","v3":"no","community":"public","user_name":"<user_name>","authentication_password":"<authentication_password>","authentication_protocol":"<authentication_protocol>","privacy_password":"<privacy_password>","privacy_protocol":"<privacy_protocol>"}]}'
<!--NeedCopy-->
Cette commande envoie une interruption de test à votre NMS avec l’icône msg_name
de TEST_TRAP
et le msg_body
de Il s’agit d’un piège de test du pool XenServer »<pool name>" pour vérifier la configuration du récepteur d’interruption NMS.
Si vous ne recevez pas l’interruption de test, vérifiez à nouveau votre configuration SNMP. En cas d’échec, le send-test-trap
renvoie également l’une des paires clé-valeur suivantes qui indiquent qu’une erreur s’est produite :
-
« code » : 1
: Chaîne d’erreur courante. Par exemple, une exception inconnue. -
« code » : 2
: Chaîne d’erreur (paramètre manquant). -
« code » : 3
: Renvoie unMessage
objet sous la forme d’une liste où chaque élément est au format[field_path, clé, valeur, chaîne d’erreur]
. -
« code » : 4
: Renvoie unMessage
objet sous la forme d’une liste où chaque élément est au format[adresse nms, port nms, chaîne d’erreur]
.
Dans cet article
- Surveiller les performances de XenServer
- Utiliser les DRR
- Alertes
- Configurer les alertes par e-mail
- Champs et balises personnalisés
- Recherches personnalisées
- Déterminer le débit des adaptateurs de bus physiques
- Surveillez les ressources host et dom0 avec NRPE
- Surveiller les ressources host et dom0 avec SNMP