Surveiller et gérer votre déploiement
XenServer fournit une surveillance détaillée des indicateurs de performance. Ces mesures incluent le processeur, la mémoire, le disque, le réseau, les informations sur l’état C-State/P-State et le stockage. Le cas échéant, ces métriques sont disponibles par hôte et par machine virtuelle. Ces mesures sont disponibles directement ou peuvent être consultées et affichées graphiquement dans XenCenter ou d’autres applications tierces.
XenServer fournit également des alertes relatives au système et aux performances. Les alertes sont des notifications qui se produisent en réponse à des événements système sélectionnés. Ces notifications se produisent également lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle. Vous pouvez configurer les alertes à l’aide de l’interface de ligne de commande xe ou à l’aide de XenCenter. Pour créer des notifications en fonction de l’une des mesures de performances de l’hôte ou de la machine virtuelle disponibles, consultez Alertes de performances.
Surveiller les performances de XenServer
Les clients peuvent surveiller les performances de leurs hôtes XenServer et de leurs machines virtuelles (VM) à l’aide des métriques exposées par le biais des bases de données Round Robin (RRD). Ces métriques peuvent être interrogées via HTTP ou via l’outil RRD2CSV. En outre, XenCenter utilise ces données pour produire des graphiques de performance du système. Pour plus d’informations, voir Analyser et visualiser des mesures.
Les tableaux suivants répertorient toutes les mesures disponibles sur les hôtes et les machines virtuelles.
Remarques :
- La latence sur une période est définie comme la latence moyenne des opérations pendant cette période.
- La disponibilité et l’utilité de certaines métriques dépendent du SR et du processeur.
Métriques d’hôtes disponibles
Nom de la métrique | Description | Condition | Nom XenCenter |
---|---|---|---|
avgqu_sz_<sr-uuid-short> |
Taille moyenne de la file d’attente d’E/S (demandes). | Au moins un VBD branché <sr-uuid-short> sur SR sur l’hôte |
sr-uuid-short Taille de la file |
cpu<cpu>-C<cstate> |
Temps cpu passé par le processeur dans l’état C cstate en millisecondes. |
L’état C existe sur le processeur | CPU cpu C-state cstate
|
cpu<cpu>-P<pstate> |
Temps cpu passé par le processeur dans l’état P pstate en millisecondes. |
L’état P existe sur le processeur | CPU cpu P-state pstate
|
cpu<cpu> |
Utilisation du processeur physique cpu (fraction). Activé par défaut. |
Le processeur cpu existe |
CPU cpu
|
cpu_avg |
Utilisation moyenne des processeurs physiques (fraction). Activé par défaut. | Aucun | UC moyenne |
hostload |
Charge de l’hôte par processeur physique, où la charge fait référence au nombre de processeurs virtuels en cours d’exécution ou exécutables. | Aucun | Charge du processeur hôte |
inflight_<sr-uuid-short> |
Nombre de demandes d’E/S actuellement en cours. Activé par défaut. | Au moins un VBD branché sr sur SR sur l’hôte |
sr Demandes en vol |
io_throughput_read_<sr-uuidshort> |
Données lues à partir du SR (Mio/s). | Au moins un VBD branché sr sur SR sur l’hôte |
sr Débit de lecture |
io_throughput_write_<sr-uuidshort> |
Données écrites dans le SR (Mio/s). | Au moins un VBD branché sr sur SR sur l’hôte |
sr Débit d’écriture |
io_throughput_total_<sr-uuidshort> |
Toutes les E/S SR (Mio/s). | Au moins un VBD branché sr sur SR sur l’hôte |
sr Débit total |
iops_read_<sr-uuid-short> |
Demandes de lecture par seconde. | Au moins un VBD branché sr sur SR sur l’hôte |
sr IOPS en lecture |
iops_write_<sr-uuid-short> |
Demandes d’écriture par seconde. | Au moins un VBD branché sr sur SR sur l’hôte |
sr IOPS en écriture |
iops_total_<sr-uuid-short> |
Demandes d’E/S par seconde. | Au moins un VBD branché sr sur SR sur l’hôte |
sr IOPS totales |
iowait_<sr-uuid-short> |
Pourcentage du temps d’attente pour les E/S. | Au moins un VBD branché sr sur SR sur l’hôte |
Attente des E/S sr
|
latency_<sr-uuid-short> |
Latence moyenne des E/S (millisecondes). | Au moins un VBD branché sr sur SR sur l’hôte |
sr Latence |
loadavg |
Moyenne de charge Domain0. Activée par défaut | Aucun | Charge du domaine de contrôle |
memory_free_kib |
Quantité totale de mémoire libre (Kio). Activé par défaut. | Aucun | Non présent dans XenCenter. Remplacé par Used Memory. |
Non signalé par la pile d’outils. Calculé par XenCenter. | Quantité totale de mémoire utilisée (KiB). Activé par défaut. | Aucun | Mémoire utilisée |
memory_reclaimed |
Mémoire de l’hôte récupérée par Squeeze (B). | Aucun | Mémoire récupérée |
memory_reclaimed_max |
Mémoire hôte disponible pour récupération avec Squeeze (B). | Aucun | Mémoire potentiellement récupérée |
memory_total_kib |
Quantité totale de mémoire (Ko) de l’hôte. Activé par défaut. | Aucun | Total Memory |
network/latency |
Intervalle en secondes entre les deux derniers battements cardiaques transmis par l’hôte local à tous les hôtes en ligne. Désactivé par défaut. | HA activé | Latence du réseau |
statefile/<vdi_uuid>/latency |
Délai d’exécution en secondes du dernier accès au State-File depuis l’hôte local. Désactivé par défaut. | HA activé | Latence des fichiers d’état HA |
pif_<pif>_rx |
Octets par seconde reçus sur l’interface physiquepif . Activé par défaut. |
Le PIF existe |
XenCenter-pifname Recevoir (voir remarque) |
pif_<pif>_tx |
Octets par seconde envoyés sur l’interface physique pif . Activé par défaut. |
Le PIF existe |
XenCenter-pifname Envoyer (voir remarque) |
pif_<pif>_rx_errors |
Recevez des erreurs par seconde sur l’interface physique pif . Désactivé par défaut. |
Le PIF existe |
XenCenter-pifname Erreurs de réception (voir remarque) |
pif_<pif>_tx_errors |
Erreurs de transmission par seconde sur l’interface physique pif . Désactivé par défaut |
Le PIF existe |
XenCenter-pifname Erreurs d’envoi (voir remarque) |
pif_aggr_rx |
Octets par seconde reçus sur toutes les interfaces physiques. Activé par défaut. | Aucun | Total de réception de la carte réseau |
pif_aggr_tx |
Octets par seconde envoyés sur toutes les interfaces physiques. Activé par défaut. | Aucun | Total des envois par carte réseau |
pvsaccelerator_evicted |
Octets par seconde supprimés du cache | PVSAccelerator activé | Taux d’expulsion de l’accélérateur PVS |
pvsaccelerator_read_hits |
Lectures par seconde diffusées à partir du cache | PVSAccelerator activé | Taux de réussite de PVSAccelerator |
pvsaccelerator_read_misses |
Lectures par seconde qui ne peuvent pas être diffusées à partir du cache | PVSAccelerator activé | Taux d’échec d’accélérateur PVS |
pvsaccelerator_traffic_client_sent |
Octets par seconde envoyés par les clients PVS mis en cache | PVSAccelerator activé | PVS-Accelerator a observé le trafic réseau des clients |
pvsaccelerator_traffic_server_sent |
Octets par seconde envoyés par les serveurs PVS mis en cache | PVSAccelerator activé | PVS-Accelerator a observé le trafic réseau provenant des serveurs |
pvsaccelerator_read_total |
Lectures par seconde observées par le cache | PVSAccelerator activé | Taux de lecture observé par l’accélérateur PVS |
pvsaccelerator_traffic_proxy_saved |
Octets par seconde envoyés par PVSAcelerator au lieu du serveur PVS | PVSAccelerator activé | Trafic réseau économisé PVS-Accelerator |
pvsaccelerator_space_utilization |
Pourcentage d’espace utilisé par PVSAcelerator sur cet hôte, par rapport à la taille totale du stockage du cache | PVSAccelerator activé | Utilisation de l’espace PVS-Accelerator |
running_vcpus |
Le nombre total de processeurs virtuels en cours d’exécution | Aucun | Nombre de processeurs virtuels en cours d’exécution |
running_domains |
Le nombre total de domaines en cours d’exécution, y compris dom0 (le domaine de contrôle de l’hôte) | Aucun | Nombre de domaines en cours d’exécution |
sr_<sr>_cache_size |
Taille en octets de la SR IntelliCache. Activé par défaut. | IntelliCache activé | Taille du cache IntelliCache |
sr_<sr>_cache_hits |
Nombre de visites du cache par seconde. Activé par défaut. | IntelliCache activé | Accès au cache IntelliCache |
sr_<sr>_cache_misses |
Manque de cache par seconde. Activé par défaut. | IntelliCache activé | Manques du cache IntelliCache |
xapi_allocation_kib |
Allocation de mémoire (Kio) effectuée par le démon XAPI. Activé par défaut. | Aucun | Allocation de mémoire à l’agent |
xapi_free_memory_kib |
Mémoire libre (Ko) disponible pour le démon XAPI. Activé par défaut. | Aucun | Mémoire de l’agent libre |
xapi_healthcheck/latency |
Délai d’exécution en secondes du dernier appel de surveillance de l’état XAPI sur l’hôte local. Désactivé par défaut. | Haute disponibilité activée | Latence de haute disponibilité de XenServer |
xapi_live_memory_kib |
Mémoire en direct (Kio) utilisée par le démon XAPI. Activé par défaut. | Aucun | Mémoire de l’agent live |
xapi_memory_usage_kib |
Mémoire totale (Ko) allouée utilisée par le démon XAPI. Activé par défaut. | Aucun | Utilisation de la mémoire de l’agent |
Métriques de VM disponibles
Nom de la métrique | Description | Condition | Nom XenCenter |
---|---|---|---|
cpu<cpu> |
Utilisation du processeur virtuel cpu (fraction). Activée par défaut |
vCPU cpu exists |
UC |
cpu_usage |
Utilisation du processeur du domaine | Aucun | cpu_usage |
memory |
Mémoire actuellement allouée à la machine virtuelle (octets) .Activé par défaut | Aucun | Total Memory |
memory_target |
Cible du pilote de ballon VM (octets). Activée par défaut | Aucun | Memory target |
memory_internal_free |
Mémoire utilisée telle que signalée par l’agent invité (KiB). Activée par défaut | Aucun | Free Memory |
runstate_fullrun |
Fraction de temps pendant laquelle tous les processeurs virtuels sont en cours d’exécution. | Aucun | vCPUs full run |
runstate_full_contention |
Fraction de temps pendant laquelle tous les processeurs virtuels peuvent être exécutés (c’est-à-dire en attente du processeur) | Aucun | vCPUs full contention |
runstate_concurrency_hazard |
Fraction de temps pendant laquelle certains processeurs virtuels sont en cours d’exécution et d’autres sont exécutables | Aucun | vCPUs concurrency hazard |
runstate_blocked |
Fraction de temps pendant laquelle tous les processeurs virtuels sont bloqués ou hors ligne | Aucun | vCPUs idle |
runstate_partial_run |
Fraction de temps pendant laquelle certains processeurs virtuels sont en cours d’exécution et d’autres sont bloqués | Aucun | vCPUs partial run |
runstate_partial_contention |
Fraction de temps pendant laquelle certains processeurs virtuels peuvent être exécutés et d’autres sont bloqués | Aucun | vCPUs partial contention |
vbd_<vbd>_write |
Écrit sur le périphérique vbd en octets par seconde. Activée par défaut |
VBD vbd exists |
Disk vbd Write |
vbd_<vbd>_read |
Lit depuis le périphérique vbd en octets par seconde. Activé par défaut. |
VBD vbd exists |
Disk vbd Read |
vbd_<vbd>_write_latency |
Écrit sur le périphérique vbd en microsecondes. |
VBD vbd exists |
Disk vbd Write Latency |
vbd_<vbd>_read_latency |
Lit depuis l’appareil vbd en microsecondes. |
VBD vbd exists |
Disk vbd Read Latency |
vbd <vbd>_iops_read |
Demandes de lecture par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disk vbd Read IOPs |
vbd <vbd>_iops_write |
Demandes d’écriture par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | E/S par seconde en écriture sur disque vbd
|
vbd <vbd>_iops_total |
Demandes d’E/S par seconde. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disk vbd Total IOPS |
vbd <vbd>_iowait |
Pourcentage de temps d’attente pour I/0. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disk vbd IO Wait |
vbd <vbd>_inflight |
Nombre de demandes d’E/S actuellement en cours. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disk vbd Inflight Requests |
vbd <vbd>_avgqu_sz |
Taille moyenne de la file d’E/S. | Au moins un VBD branché pour VDI non ISO sur l’hôte | Disk vbd Queue Size |
vif_<vif>_rx |
Octets par seconde reçus sur le numéro d’interface virtuelle vif . Activé par défaut. |
VIF vif exists |
vif Receive |
vif_<vif>_tx |
Octets par seconde transmis sur l’interface virtuelle vif . Activé par défaut. |
VIF vif exists |
vif Envoyer |
vif_<vif>_rx_errors |
Recevez des erreurs par seconde sur l’interface virtuelle vif . Activé par défaut. |
VIF vif exists |
vif Receive Errors |
vif_<vif>_tx_errors |
Erreurs de transmission par seconde sur l’interface virtuelle vif Activé par défaut. |
VIF vif exists |
vif Send Errors |
Remarque :
La valeur de
<XenCenter-pif-name>
peut être l’une des valeurs suivantes :
NIC <pif>
- si<pif>
contientpif_eth#
, où##
est compris entre 0 et 9<pif>
- si<pif>
contientpif_eth#.##
oupif_xenbr##
oupif_bond##
<Internal> Network <pif>
- si<pif>
contientpif_xapi##
, (notez que<Internal>
apparaît tel quel)TAP <tap>
- si<pif>
contientpif_tap##
xapi Loopback
- si<pif>
contientpif_lo
Analyser et visualiser les mesures
L’onglet Performances de XenCenter fournit une surveillance en temps réel des statistiques de performances sur l’ensemble des pools de ressources, en plus des tendances graphiques des performances des machines virtuelles et physiques. Les graphiques montrant les E/S du processeur, de la mémoire, du réseau et du disque sont inclus par défaut dans l’onglet Performances. Vous pouvez ajouter d’autres mesures, modifier l’apparence des graphiques existants ou en créer d’autres. Pour plus d’informations, consultez Configuration des métriques dans la section suivante.
-
Vous pouvez afficher jusqu’à 12 mois de données de performances et effectuer un zoom avant pour regarder de plus près les pics d’activité.
-
XenCenter peut générer des alertes de performance lorsque l’utilisation du processeur, de la mémoire, des E/S réseau, des E/S de stockage ou des E/S de disque dépasse un seuil spécifié sur un hôte, une machine virtuelle ou un SR. Pour plus d’informations, consultez Alertes dans la section suivante.
Remarque :
Installez XenServer VM Tools pour consulter les données complètes sur les performances des machines virtuelles.
Configuration des graphiques de performance
Pour ajouter un graphique :
-
Dans l’onglet Performances, cliquez sur Actions, puis sur Nouveau graphique. La boîte de dialogue Nouveau graphique s’affiche.
-
Dans le champ Nom, entrez le nom du graphique.
-
Dans la liste des sources de données, cochez les cases correspondant aux sources de données que vous souhaitez inclure dans le graphique.
-
Cliquez sur Enregistrer.
Pour modifier un graphique existant :
-
Accédez à l’onglet Performances et sélectionnez le graphique que vous souhaitez modifier.
-
Cliquez avec le bouton droit sur le graphique et sélectionnez Actions, ou cliquez sur le bouton Actions . Sélectionnez ensuite Modifier le graphique.
-
Dans la fenêtre des détails du graphique, apportez les modifications nécessaires, puis cliquez sur OK.
Configuration du type de graphe
Les données des graphiques de performance peuvent être affichées sous forme de lignes ou de zones. Pour modifier le type de graphique :
-
Dans le menu Outils, cliquez sur Options et sélectionnez Graphiques.
-
Pour afficher les données de performance sous forme de graphique linéaire, cliquez sur l’option Graphique linéaire .
-
Pour afficher les données de performance sous forme de graphique en aires, cliquez sur l’option Graphique en aires.
-
Cliquez sur OK pour enregistrer vos modifications.
Vous trouverez des détails complets sur la configuration et l’affichage des graphiques de performances XenCenter dans la section Surveillance des performances du systèmedans la documentation XenCenter.
Configurer les mesures
Remarque :
Les états C et P sont des fonctionnalités de gestion de l’alimentation de certains processeurs. La plage d’états disponibles dépend des capacités physiques de l’hôte, ainsi que de la configuration de la gestion de l’alimentation.
Les commandes host et VM renvoient les informations suivantes :
-
Une description complète de la source de données
-
Les unités appliquées à la métrique
-
La plage de valeurs possibles pouvant être utilisées
Par exemple :
name_label: cpu0-C1
name_description: Proportion of time CPU 0 spent in C-state 1
enabled: true
standard: true
min: 0.000
max: 1.000
units: Percent
<!--NeedCopy-->
Activer une métrique spécifique
La plupart des mesures sont activées et collectées par défaut. Pour activer les mesures qui ne le sont pas, entrez ce qui suit :
xe host-data-source-record data-source=metric name host=hostname
<!--NeedCopy-->
Désactiver une métrique spécifique
Il se peut que vous ne souhaitiez pas collecter certaines statistiques régulièrement. Pour désactiver une mesure précédemment activée, entrez ce qui suit :
xe host-data-source-forget data-source=metric name host=hostname
<!--NeedCopy-->
Afficher une liste des métriques d’hôtes actuellement activées
Pour répertorier les métriques d’hôtes actuellement collectées, entrez les informations suivantes :
xe host-data-source-list host=hostname
<!--NeedCopy-->
Afficher la liste des métriques de VM actuellement activées
Pour héberger les métriques de VM en cours de collecte, entrez les informations suivantes :
xe vm-data-source-list vm=vm_name
<!--NeedCopy-->
Utiliser des RRD
XenServer utilise des RRD pour stocker les mesures de performance. Ces RRD se composent de plusieurs archives Round Robin (RRA) dans une base de données de taille fixe.
Chaque archive de la base de données échantillonne sa métrique particulière selon une granularité spécifiée :
- Toutes les 5 secondes pendant 10 minutes
- Toutes les minutes des deux dernières heures
- Toutes les heures de la semaine dernière
- Tous les jours depuis un an
L’échantillonnage qui a lieu toutes les cinq secondes enregistre les points de données réels, mais les RRA suivants utilisent des fonctions de consolidation à la place. Les fonctions de consolidation prises en charge par XenServer sont les suivantes :
- MOYENNE
- MIN
- MAXIMUM
Les RRD existent pour les machines virtuelles individuelles (y compris dom0) et pour l’hôte XenServer. Les RRD de VM sont stockés sur l’hôte sur lequel ils s’exécutent, ou sur le coordinateur de pool lorsqu’ils ne sont pas en cours d’exécution Par conséquent, l’emplacement d’une machine virtuelle doit être connu pour récupérer les données de performances associées.
Pour des informations détaillées sur l’utilisation des RRD XenServer, consultez le guide du kit de développement logiciel XenServer.
Analyser les RRD à l’aide de HTTP
Vous pouvez télécharger des RRD via HTTP depuis l’hôte XenServer spécifié à l’aide du gestionnaire HTTP enregistré sur /host_rrd
ou /vm_rrd
. Les deux adresses nécessitent une authentification soit par authentification HTTP, soit en fournissant des références de session d’API de gestion valides en tant qu’argument de requête. Par exemple :
Téléchargez un RRD hôte.
wget http://server/host_rrd?session_id=OpaqueRef:SESSION HANDLE>
<!--NeedCopy-->
Téléchargez un RRD de machine virtuelle.
wget http://server/vm_rrd?session_id=OpaqueRef:SESSION HANDLE>&uuid=VM UUID>
<!--NeedCopy-->
Ces deux appels téléchargent le XML dans un format qui peut être importé dans le rrdtool
pour analyse ou analysé directement.
Analyser les RRD à l’aide de rrd2csv
Outre l’affichage des mesures de performance dans XenCenter, l’outil rrd2csv enregistre les RRD au format CSV (Comma Separated Value). Des pages de manuel et d’aide sont fournies. Pour afficher le manuel de l’outil rrd2csv ou les pages d’aide, exécutez la commande suivante :
man rrd2csv
<!--NeedCopy-->
Ou
rrd2csv --help
<!--NeedCopy-->
Remarque :
Lorsque plusieurs options sont utilisées, fournissez-les individuellement. Par exemple : pour renvoyer à la fois l’UUID et l’étiquette de nom associés à une machine virtuelle ou à un hôte, appelez rrd2csv comme indiqué ci-dessous :
rrd2csv -u -n
L’UUID renvoyé est unique et convient comme clé primaire, mais le nom-étiquette d’une entité n’est pas nécessairement unique.
La page de manuel (rrd2csv --help
) est le texte d’aide définitif de l’outil.
Alertes
Vous pouvez configurer XenServer pour générer des alertes en fonction de l’une des métriques d’hôte ou de machine virtuelle disponibles. En outre, XenServer fournit des alertes préconfigurées qui se déclenchent lorsque les hôtes sont soumis à certaines conditions et à certains états. Vous pouvez afficher ces alertes à l’aide de XenCenter ou de l’interface de ligne de commande xe.
Afficher les alertes en utilisant XenCenter
Vous pouvez afficher différents types d’alertes dans XenCenter en cliquant sur Notifications, puis sur Alertes. La vue Alertes affiche différents types d’alertes, y compris les alertes de performance, les alertes système et les alertes de mise à jour logicielle.
Alertes de performance
Des alertes de performance peuvent être générées lorsque l’une des valeurs suivantes dépasse un seuil spécifié sur un hôte géré, une machine virtuelle ou un référentiel de stockage (SR) : utilisation du processeur, utilisation du réseau, utilisation de la mémoire, utilisation de la mémoire du domaine de contrôle, débit de stockage ou utilisation du disque de la machine virtuelle.
Par défaut, l’intervalle de répétition des alertes est défini sur 60 minutes, il peut être modifié si nécessaire. Les alertes sont affichées sur la page Alertes de la zone Notifications de XenCenter. Vous pouvez également configurer XenCenter pour envoyer un e-mail pour toutes les alertes de performances spécifiées ainsi que d’autres alertes système sérieuses.
Toutes les alertes personnalisées configurées à l’aide de l’interface de ligne de commande xe sont également affichées sur la page Alertes de XenCenter.
Chaque alerte a un niveau de priorité/gravité correspondant. Vous pouvez modifier ces niveaux et éventuellement choisir de recevoir un e-mail lorsque l’alerte est déclenchée. La priorité/gravité de l’alerte par défaut est définie sur 3
.
Priority | Nom | Description | Alerte e-mail par défaut |
---|---|---|---|
1 | Critical | Agissez maintenant ou les données risquent d’être définitivement perdues/corrompues. | Oui |
2 | Major | Agissez maintenant ou certains services risquent d’échouer. | Oui |
3 | Avertissement | Agissez maintenant ou un service pourrait en pâtir. | Oui |
4 | Mineur | Notez que quelque chose vient d’être amélioré. | Non |
5 | Information | Informations quotidiennes (démarrage, arrêt, reprise des machines virtuelles, etc.) | Non |
? | Inconnu | Erreur inconnue | Non |
Configuration des alertes de performance
-
Dans le volet Ressources, sélectionnez l’hôte, la machine virtuelle ou le SR approprié, puis cliquez sur l’onglet Général, puis sur Propriétés.
-
Sélectionnez l’onglet Alertes. Le tableau suivant récapitule les alertes disponibles pour les hôtes, les machines virtuelles ou les SR :
Nom de l’alerte Hôte VM SR Description Générer des alertes d’utilisation du processeur X X Définissez l’utilisation du processeur et le seuil de temps qui déclenchent l’alerte. Générez des alertes d’utilisation du processeur dans le domaine de contrôle X Définissez l’utilisation du processeur du domaine de contrôle et le seuil temporel qui déclenchent l’alerte. Générez des alertes d’utilisation de la mémoire X Définissez l’utilisation de la mémoire et le seuil de temps qui déclenchent l’alerte. Générer des alertes d’utilisation de la mémoire du domaine de contrôle X Définissez l’utilisation de la mémoire du domaine de contrôle et le seuil temporel qui déclenchent l’alerte. Générez des alertes de mémoire libre pour le domaine de contrôle X Définissez la mémoire libre du domaine de contrôle et le seuil temporel qui déclenchent l’alerte. Générer des alertes d’utilisation du disque X Définissez l’utilisation du disque et le seuil de temps de déclenchement de l’alerte. Générez des alertes relatives au débit de stockage X Définissez le débit de stockage et le seuil de temps qui déclenchent l’alerte. Remarque : les périphériques à blocs physiques (PBD) représentent l’interface entre un hôte XenServer spécifique et un SR connecté. Lorsque l’activité de débit SR totale en lecture/écriture sur un PBD dépasse le seuil spécifié, des alertes sont générées sur l’hôte connecté au PBD. Contrairement aux autres alertes d’hôte XenServer, cette alerte doit être configurée sur le SR. Générez des alertes d’utilisation du réseau X X Définissez l’utilisation du réseau et le seuil de temps qui déclenchent l’alerte. Pour modifier l’intervalle de répétition des alertes, entrez le nombre de minutes dans la zone Intervalle de répétition des alertes . Lorsqu’un seuil d’alerte a été atteint et qu’une alerte est générée, une autre alerte n’est générée qu’après l’expiration de l’intervalle de répétition des alertes.
-
Cliquez sur OK pour enregistrer vos modifications.
Pour obtenir des informations complètes sur la façon d’afficher, de filtrer et de configurer les niveaux de gravité pour les alertes de performance, consultez Configuration des alertes de performance dans la documentation XenCenter.
Alertes système
Le tableau suivant répertorie les événements/conditions système qui déclenchent l’affichage d’une alerte sur la page Alertes de XenCenter.
Nom | Priorité/gravité | Description |
---|---|---|
license_expires_soon | 2 | Le contrat de licence XenServer expire bientôt. |
ha-statefile_lost | 2 | Perte de contact avec le référentiel de stockage haute disponibilité, agissez bientôt. |
ha-heartbeat_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise. |
ha_statefile_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise. |
haxapi_healthcheck_approaching_timeout | 5 | La haute disponibilité approche du délai d’expiration, l’hôte peut redémarrer si aucune mesure n’est prise. |
ha_network_bonding_error | 3 | Perte de service potentielle. Perte du réseau qui envoie des pulsations haute disponibilité. |
ha_pool_overcommited | 3 | Perte de service potentielle. La haute disponibilité ne permet pas de garantir la protection des machines virtuelles configurées. |
ha_poor_drop_in_plan_exists_for | 3 | La couverture de haute disponibilité a diminué, plus susceptible d’échouer, aucune perte n’est encore présente. |
ha_protected_vm_restart_failed | 2 | Perte de service. La haute disponibilité n’a pas pu redémarrer une machine virtuelle protégée. |
ha_host_failed | 3 | La haute disponibilité a détecté la défaillance d’un hôte. |
ha_host_was_fenced | 4 | La haute disponibilité a redémarré un hôte pour se protéger contre la corruption des machines virtuelles. |
redo_log_healthy | 4 | Le journal de rétablissement XAPI s’est rétabli suite à une erreur précédente. |
redo_log_broken | 3 | Le journal de rétablissement XAPI a rencontré une erreur. |
ip_configured_pif_can_unplug | 3 | Une carte réseau configurée par IP peut être débranchée par XAPI lors de l’utilisation de la haute disponibilité, ce qui peut entraîner une défaillance de la haute disponibilité. |
host_sync_data_failed | 3 | Impossible de synchroniser les statistiques de performance de XenServer. |
host_clock_skew_detected | 3 | L’horloge de l’hôte n’est pas synchronisée avec les autres hôtes du pool. |
host_clock_went_backwards | 1 | L’horloge de l’hôte est corrompue. |
pool_master_transition | 4 | Un nouvel hôte a été spécifié en tant que coordinateur de pool. |
pbd_plug_failed_on_server_start | 3 | L’hôte n’a pas réussi à se connecter au stockage au moment du démarrage. |
auth_external_init_failed | 2 | L’hôte n’a pas réussi à activer l’authentification AD externe. |
auth_external_pool_non-homogeneous | 2 | Les hôtes d’un pool ont une configuration d’authentification AD différente. |
multipath_period_alert | 3 | Un chemin d’accès à un SR a échoué ou a été rétabli. |
bond-status-changed | 3 | Un lien d’une liaison s’est déconnecté ou reconnecté. |
Alertes de mise à jour logicielle
- XenCenter ancien : XenServer attend une version plus récente mais peut toujours se connecter à la version actuelle
- XenCenter obsolète : XenCenter est trop ancien pour se connecter à XenServer
- XenServer obsolète : XenServer est une ancienne version à laquelle le XenCenter actuel ne peut pas se connecter
- Alerte d’expiration de licence : la licence XenServer a expiré
- Alerte IQN manquante : XenServer utilise le stockage iSCSI mais l’IQN de l’hôte est vide
- Alerte IQN dupliquée : XenServer utilise le stockage iSCSI et il existe des IQN hôtes dupliqués
Configuration des alertes de performance à l’aide de l’interface de ligne
Remarque :
Les déclencheurs d’alertes sont vérifiés à un intervalle minimum de cinq minutes. Cet intervalle évite d’imposer une charge excessive au système pour vérifier ces conditions et de signaler les faux positifs. Si vous définissez un intervalle de répétition des alertes inférieur à cinq minutes, les alertes sont toujours générées à l’intervalle minimum de cinq minutes.
L’outil de surveillance des performances perfmon
s’exécute toutes les cinq minutes et demande à XenServer des mises à jour d’une durée moyenne supérieure à une minute. Ces valeurs par défaut peuvent être modifiées dans /etc/sysconfig/perfmon
.
L’ perfmon
outil lit les mises à jour toutes les cinq minutes des variables de performance exécutées sur le même hôte. Ces variables sont divisées en un groupe relatif à l’hôte lui-même et en un groupe pour chaque machine virtuelle exécutée sur cet hôte. Pour chaque machine virtuelle et hôte, perfmon
lit le paramètre other-config:perfmon
et utilise cette chaîne pour déterminer les variables à surveiller et dans quelles circonstances générer un message.
Par exemple, ce qui suit illustre un exemple de configuration d’une alerte « utilisation du processeur » de machine virtuelle en écrivant une chaîne XML dans le paramètre other-config:perfmon
:
xe vm-param-set uuid=vm_uuid other-config:perfmon=\
'<config>
<variable>
<name value="cpu_usage"/>
<alarm_trigger_level value="0.5"/>
</variable>
</config>'
<!--NeedCopy-->
Remarque :
Vous pouvez utiliser plusieurs nœuds de variables.
Après avoir défini la nouvelle configuration, utilisez la commande suivante perfmon
pour actualiser chaque hôte :
xe host-call-plugin host=host_uuid plugin=perfmon fn=refresh
<!--NeedCopy-->
Si cette actualisation n’est pas effectuée, il y a un délai avant que la nouvelle configuration ne prenne effet, car par défaut, perfmon
vérifie la présence d’une nouvelle configuration toutes les 30 minutes. Cette valeur par défaut peut être modifiée dans/etc/sysconfig/perfmon
.
Eléments VM valides
-
name
: nom de la variable (pas de valeur par défaut). Si la valeur de nom estcpu_usage
,network_usage
, oudisk_usage
, les paramètresrrd_regex
etalarm_trigger_sense
ne sont pas requis comme valeurs par défaut pour ces valeurs sont utilisées. -
alarm_priority
: priorité des alertes générées (par défaut3
). -
alarm_trigger_level
: niveau de valeur qui déclenche une alerte (pas par défaut). -
alarm_trigger_sense
: la valeur esthigh
ifalarm_trigger_level
est une valeur maximale,low
sinon s’il s’alarm_trigger_level
agit d’une valeur minimale (valeur par défauthigh
). -
alarm_trigger_period
: nombre de secondes pendant lesquelles des valeurs (au-dessus ou au-dessous du seuil d’alerte) peuvent être reçues avant l’envoi d’une alerte (la valeur par défaut est60
). -
alarm_auto_inhibit_period
: nombre de secondes pendant lesquelles cette alerte sera désactivée après l’envoi d’une alerte (la valeur par défaut est3600
). -
consolidation_fn
: combine les variables de rrd_updates en une seule valeur. Pourcpu-usage
la valeur par défaut estaverage
, pourfs_usage
la valeur par défaut estget_percent_fs_usage
et pour tous les autres -sum
. -
rrd_regex
: fait correspondre les noms des variables dexe vm-data-sources-list uuid=vm_uuid
, pour calculer les valeurs de performance. Ce paramètre possède des valeurs par défaut pour les variables nommées :- cpu_usage
- memory_internal_free
- network_usage
- disk_usage
S’il est spécifié, les valeurs de tous les éléments renvoyés par les noms xe vm-data-source-list
dont le nom correspond à l’expression régulière spécifiée sont consolidées à l’aide de la méthode spécifiée en tant que consolidation_fn
.
Eléments hôtes valides
-
name
: nom de la variable (pas de valeur par défaut). -
alarm_priority
: priorité des alertes générées (par défaut3
). -
alarm_trigger_level
: niveau de valeur qui déclenche une alerte (pas par défaut). -
alarm_trigger_sense
: La valeur esthigh
quandalarm_trigger_level
est une valeur maximale sinonlow
si lealarm_trigger_level
est un valeur minimale. (par défauthigh
) -
alarm_trigger_period
: nombre de secondes pendant lesquelles des valeurs (supérieures ou inférieures au seuil d’alerte) peuvent être reçues avant qu’une alerte ne soit envoyée (par défaut60
). -
alarm_auto_inhibit_period
: nombre de secondes pendant lesquelles l’alerte est désactivée après l’envoi d’une alerte. (par défaut3600
). -
consolidation_fn
: combine les variablesrrd_updates
en une seule valeur (par défautsum
- ouaverage
) -
rrd_regex
: expression régulière qui correspond aux noms des variables renvoyées par la commandexe vm-data-source-list uuid=vm_uuid
à utiliser pour calculer la valeur statistique. Ce paramètre possède des valeurs par défaut pour les variables nommées suivantes :- cpu_usage
- network_usage
- memory_free_kib
- sr_io_throughput_total_xxxxxxxx (où
xxxxxxxx
sont les huit premiers caractères de l’UUID SR-).
Débit SR : les alertes de débit de stockage doivent être configurées sur le SR plutôt que sur l’hôte. Par exemple :
xe sr-param-set uuid=sr_uuid other-config:perfmon=\
'<config>
<variable>
<name value="sr_io_throughput_total_per_host"/>
<alarm_trigger_level value="0.01"/>
</variable>
</config>'
<!--NeedCopy-->
Exemple de configuration générique
L’exemple suivant montre une configuration générique :
<config>
<variable>
<name value="NAME_CHOSEN_BY_USER"/>
<alarm_trigger_level value="THRESHOLD_LEVEL_FOR_ALERT"/>
<alarm_trigger_period value="RAISE_ALERT_AFTER_THIS_MANY_SECONDS_OF_BAD_VALUES"/>
<alarm_priority value="PRIORITY_LEVEL"/>
<alarm_trigger_sense value="HIGH_OR_LOW"/>
<alarm_auto_inhibit_period value="MINIMUM_TIME_BETWEEN_ALERT_FROM_THIS_MONITOR"/>
<consolidation_fn value="FUNCTION_FOR_COMBINING_VALUES"/>
<rrd_regex value="REGULAR_EXPRESSION_TO_CHOOSE_DATASOURCE_METRIC"/>
</variable>
<variable>
...
</variable>
...
</config>
<!--NeedCopy-->
Configuration des alertes par e-mail
Vous pouvez configurer XenServer pour envoyer des notifications par e-mail lorsque les hôtes XenServer génèrent des alertes. L’utilitaire mail-alarm de XenServer utilise SSmTP pour envoyer ces notifications par e-mail. Vous pouvez activer les alertes par e-mail de base à l’aide de XenCenter ou de l’interface de ligne de commande (CLI) xe. Pour une configuration plus poussée des alertes par e-mail, vous pouvez modifier le fichier mail-alarm.conf
de configuration.
Utilisez un serveur SMTP qui ne nécessite pas d’authentification. Les e-mails envoyés via des serveurs SMTP qui nécessitent une authentification ne peuvent pas être distribués.
Activer les alertes par e-mail à l’aide de XenCenter
-
Dans le volet
Resources
, cliquez avec le bouton droit sur un pool et sélectionnezProperties
. -
Dans la fenêtre
Properties
, sélectionnezEmail Options
. -
Cochez la case
Send email alert notifications
. Entrez votre adresse de destination préférée pour les e-mails de notification et les détails du serveur SMTP. -
Choisissez la langue de votre choix dans la liste
Mail language
. La langue par défaut pour les e-mails d’alerte de performance est l’anglais.
Activer les alertes par e-mail à l’aide de l’interface de ligne
Pour configurer les alertes par e-mail, spécifiez votre adresse de destination préférée pour les e-mails de notification et le serveur SMTP :
xe pool-param-set uuid=pool_uuid other-config:mail-destination=joe.bloggs@example.com
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com:<port>
<!--NeedCopy-->
XenServer configure automatiquement l’adresse de l’expéditeur en tant que noreply@<hostname>
. Vous pouvez toutefois définir l’adresse de l’expéditeur de manière explicite :
xe pool-param-set uuid=pool_uuid other-config:mail-sender=serveralerts@example.com
<!--NeedCopy-->
Lorsque vous activez les notifications par e-mail, vous recevez une notification par e-mail lorsqu’une alerte avec une priorité de 3 ou plus est générée. Par conséquent, le niveau de priorité minimum par défaut est 3
. Vous pouvez modifier cette valeur par défaut à l’aide de la commande suivante :
xe pool-param-set uuid=pool_uuid other-config:mail-min-priority=level
<!--NeedCopy-->
Remarque :
Certains serveurs SMTP transmettent uniquement les messages dont les adresses utilisent des noms de domaine complets. Si vous constatez que les e-mails ne sont pas transférés, c’est peut-être pour cette raison. Dans ce cas, vous pouvez définir le nom d’hôte du serveur sur le nom de domaine complet afin que cette adresse soit utilisée lors de la connexion à votre serveur de messagerie.
Pour configurer la langue des e-mails d’alerte de performance :
xe pool-param-set uuid=pool_uuid other-config:mail-language=ja-JP
<!--NeedCopy-->
La langue par défaut pour les e-mails d’alerte de performance est l’anglais.
Configuration supplémentaire
Pour configurer davantage l’utilitaire mail-alarm dans XenServer, créez un /etc/mail-alarm.conf
fichier contenant les éléments suivants :
root=postmaster
authUser=<username>
authPass=<password>
mailhub=@MAILHUB@
<!--NeedCopy-->
/etc/mail-alarm.conf
est un modèle fourni par l’utilisateur pour le fichier de configuration de SSmTP ssmtp.conf
et est utilisé pour toutes les alertes générées par les hôtes XenServer. Il se compose de touches où key=@KEY@
et @KEY@
est remplacé par la valeur correspondante de ssmtp-key
in pool.other_config
. Ces valeurs sont ensuite transmises à ssmtp, ce qui vous permet de contrôler certains aspects de la configuration SSmtp à l’aide des valeurs de pool.other_config
. Notez comment @KEY@
(majuscule) correspond à ssmtp-key
(minuscule, préfixé par ssmtp-
).
Par exemple, si vous configurez le serveur SMTP :
xe pool-param-set uuid=pool_uuid other-config:ssmtp-mailhub=smtp.example.com
<!--NeedCopy-->
puis ajoutez ce qui suit à votre /etc/mail-alarm.conf
fichier :
mailhub=@MAILHUB@
<!--NeedCopy-->
mailhub=@MAILHUB@
devient mailhub=smtp.example.com
.
La configuration de chaque serveur SMTP peut légèrement différer et nécessiter une configuration supplémentaire. Pour configurer davantage SSmTP, modifiez son fichier de configuration ssmtp.conf
. En stockant les clés pertinentes dans le fichier mail-alarm.conf
, vous pouvez utiliser les valeurs pool.other_config
pour configurer sSMTP. L’extrait suivant de la page de ssmtp.conf
manuel présente la syntaxe correcte et les options disponibles :
NAME
ssmtp.conf – ssmtp configuration file
DESCRIPTION
ssmtp reads configuration data from /etc/ssmtp/ssmtp.conf The file con-
tains keyword-argument pairs, one per line. Lines starting with '#'
and empty lines are interpreted as comments.
The possible keywords and their meanings are as follows (both are case-
insensitive):
Root
The user that gets all mail for userids less than 1000. If blank,
address rewriting is disabled.
Mailhub
The host to send mail to, in the form host | IP_addr port :
<port>. The default port is 25.
RewriteDomain
The domain from which mail seems to come. For user authentication.
Hostname
The full qualified name of the host. If not specified, the host
is queried for its hostname.
FromLineOverride
Specifies whether the From header of an email, if any, may over-
ride the default domain. The default is "no".
UseTLS
Specifies whether ssmtp uses TLS to talk to the SMTP server.
The default is "no".
UseSTARTTLS
Specifies whether ssmtp does a EHLO/STARTTLS before starting TLS
negotiation. See RFC 2487.
TLSCert
The file name of an RSA certificate to use for TLS, if required.
AuthUser
The user name to use for SMTP AUTH. The default is blank, in
which case SMTP AUTH is not used.
AuthPass
The password to use for SMTP AUTH.
AuthMethod
The authorization method to use. If unset, plain text is used.
May also be set to "cram-md5".
<!--NeedCopy-->
Champs et balises personnalisés
XenCenter prend en charge la création de balises et de champs personnalisés, ce qui permet l’organisation et la recherche rapide des machines virtuelles, du stockage, etc. Pour plus d’informations, consultez la section Surveillance des performances du système.
Recherches personnalisées
XenCenter prend en charge la création de recherches personnalisées. Les recherches peuvent être exportées et importées, et les résultats d’une recherche peuvent être affichés dans le volet de navigation. Pour plus d’informations, consultez la section Surveillance des performances du système.
Déterminer le débit des adaptateurs de bus physiques
Pour les adaptateurs HBA FC, SAS et iSCSI, vous pouvez déterminer le débit réseau de vos PBD à l’aide de la procédure suivante.
- Répertoriez les PBD sur un hôte.
- Déterminez quels LUN sont routés sur quels PBD.
- Pour chaque PBD et SR, répertoriez les VBD qui font référence aux VDI sur le SR.
- Pour tous les VBD actifs attachés aux machines virtuelles de l’hôte, calculez le débit combiné.
Pour le stockage iSCSI et NFS, vérifiez vos statistiques réseau pour déterminer s’il existe un goulot d’étranglement de débit sur la baie ou si le PBD est saturé.
Surveillez les ressources de l’hôte et du dom0 avec NRPE
Remarque :
La fonctionnalité NRPE est disponible pour les clients de XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, voir Licences. Pour effectuer une mise à niveau ou acheter une licence XenServer, visitez le site Web de XenServer.
Les utilisateurs dotés du rôle d’administrateur du pool peuvent utiliser n’importe quel outil de surveillance tiers prenant en charge le Nagios Remote Plugin Executor (NRPE) pour surveiller les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte.
Vous pouvez utiliser les plugins de vérification suivants pour surveiller les ressources host et dom0 :
Métrique | Nom de la vérification NRPE | Description | Seuil d’alerte par défaut | Seuil critique par défaut | Données de performance renvoyées |
---|---|---|---|---|---|
Charge du processeur hôte | check_host_load | Obtient et vérifie la charge actuelle par processeur physique de l’hôte, où la charge fait référence au nombre de processeurs virtuels en cours d’exécution ou exécutables. | 3 | 4 | Charge système actuelle du processeur de l’hôte (calculée en prenant la charge moyenne du processeur physique de l’hôte). |
Utilisation du processeur hôte (%) | check_host_cpu | Obtient et vérifie l’utilisation globale actuelle du processeur de l’hôte. | 80 % | 90 % | Le pourcentage du processeur hôte actuellement libre et le pourcentage utilisé. |
Utilisation de la mémoire hôte (%) | check_host_memory | Obtient et vérifie l’utilisation actuelle de la mémoire par l’hôte. | 80 % | 90 % | Le pourcentage de mémoire hôte actuellement libre et le pourcentage utilisé. |
Utilisation du vGPU hôte (%) | check_vgpu | Obtient et vérifie toute l’utilisation actuelle du vGPU Nvidia en cours d’exécution sur l’hôte. | 80 % | 90 % | Le pourcentage de vGPU en cours d’exécution qui est actuellement gratuit et le pourcentage utilisé. |
Utilisation de la mémoire du vGPU hôte (%) | check_vgpu_memory | Obtient et vérifie toute l’utilisation actuelle de la mémoire Nvidia vGPU (y compris la mémoire partagée et la mémoire graphique) de l’hôte. | 80 % | 90 % | Le pourcentage de mémoire vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) qui est actuellement libre et le pourcentage utilisé. |
Charge du processeur Dom0 | check_load | Obtient et vérifie la charge moyenne actuelle du système par processeur de dom0, où la charge fait référence au nombre de processus en cours ou exécutables. | 2.7, 2.6, 2.5 | 3.2, 3.1, 3 | Les données de charge du processeur hôte sont calculées en prenant la moyenne des 1, 5 et 15 dernières minutes. |
Utilisation du processeur Dom0 (%) | check_cpu | Obtient et vérifie l’utilisation globale actuelle du processeur de dom0. | 80 % | 90 % | L’utilisation globale moyenne du processeur de dom0 en pourcentage. |
Utilisation de la mémoire Dom0 (%) | check_memory | Obtient et vérifie l’utilisation actuelle de la mémoire de dom0. | 80 % | 90 % | Le pourcentage de mémoire dom0 actuellement libre et le pourcentage utilisé. |
Remplacement disponible Dom0 (%) | check_swap | Obtient et vérifie l’utilisation actuelle du swap de dom0. | 20 % | 10 % | Le pourcentage de Mo actuellement gratuits sur dom0. |
Espace libre de la partition racine Dom0 (%) | check_disk_root | Obtient et vérifie l’utilisation actuelle de la partition racine de dom0. | 20 % | 10 % | Le pourcentage de Mo sur la partition racine dom0 qui est actuellement libre. |
Espace libre sur la partition Dom0 Log (%) | check_disk_log | Obtient et vérifie l’utilisation actuelle de la partition de journal de dom0. | 20 % | 10 % | Le pourcentage de Mo sur la partition de journal dom0 qui est actuellement libre. |
État de la pile d’outils | check_xapi | Obtient et vérifie l’état de la pile d’outils de gestion XenServer (également appelée XAPI). | Le temps de disponibilité de XAPI s’est écoulé en quelques secondes. | ||
État du multipath | check_multipath | Obtient et vérifie l’état des chemins de stockage. | État des chemins de stockage. OK indique que tous les chemins sont actifs, WARNING indique que certains chemins ont échoué mais que plusieurs chemins sont actifs, CRITICAL indique qu’il n’y a qu’un seul chemin actif ou que tous les chemins ont échoué, UNKNOWN indique que le multiacheminement des hôtes est désactivé et que l’état des chemins ne peut pas être récupéré. |
NRPE est un service sur site qui s’exécute dans dom0 et écoute sur le port TCP (par défaut) 5666 les demandes d’exécution de contrôles provenant d’un outil de surveillance. Une fois qu’une demande est arrivée, NRPE l’analyse, trouve la commande de vérification correspondante, y compris les détails du paramètre, dans le fichier de configuration, puis l’exécute. Le résultat du contrôle est envoyé à l’outil de surveillance, qui enregistre les résultats des contrôles antérieurs et fournit un graphique présentant les données de performance historiques.
Logiciels requis
Pour pouvoir utiliser NRPE pour surveiller les ressources de l’hôte et du dom0, l’outil de surveillance que vous utilisez doit répondre aux prérequis suivants :
- L’outil de surveillance doit être compatible avec la version 4.1.0 de NRPE.
- Pour permettre la communication entre NRPE et l’outil de surveillance, l’outil de surveillance doit prendre en charge le protocole TLS 1.2 avec des chiffrements
ECDHE-RSA-AES256-GCM-SHA384
etECDHE-RSA-AES128-GCM-SHA256
, et la courbe EC estsecp384r1
.
Contraintes
- Vous pouvez configurer les paramètres NRPE pour un pool entier ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres NRPE pour un hôte individuel d’un pool.
-
Si vous ajoutez un hôte à un pool sur lequel NRPE est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres NRPE du pool au nouvel hôte. Vous devez reconfigurer les paramètres NRPE sur le pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres NRPE avant de l’ajouter au pool.
Remarque :
Lorsque vous reconfigurez les paramètres NRPE sur un pool après avoir ajouté un nouvel hôte, assurez-vous que l’hôte est opérationnel.
- Si un hôte est supprimé d’un pool sur lequel le NRPE est activé et configuré, XenCenter ne modifie pas les paramètres NPRE de l’hôte ou du pool.
Configurer NRPE à l’aide de l’interface de ligne de commande xe
Vous pouvez configurer NRPE à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration de NRPE à l’aide de XenCenter, consultez la section Surveillance des ressources hôte etdom0 avec NRPE.
Après avoir modifié la configuration de NRPE, redémarrez le service NRPE à l’aide de :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->
Activer NRPE
NRPE est désactivé par défaut dans XenServer. Pour activer NRPE sur le domaine de contrôle d’un hôte (dom0), exécutez les commandes suivantes dans l’interface de ligne de commande xe :
-
Obtenez l’UUID de l’hôte que vous souhaitez surveiller :
xe host-list
-
Activez NRPE sur l’hôte :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable
Si l’opération s’exécute correctement, cette commande est générée
Success
. Lorsque XenServer redémarre, NRPE démarre automatiquement.
Pour arrêter, démarrer, redémarrer ou désactiver NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->
où l’opération est stop
, start
, restart
, ou disable
.
Serveurs de surveillance
Il s’agit d’une liste séparée par des virgules d’adresses IP ou de noms d’hôtes autorisés à communiquer avec le démon NRPE. Les adresses réseau comportant un masque de bits (par exemple 192.168.1.0/24
) sont également prises en charge.
Consultez la liste actuelle des serveurs de surveillance :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->
Autorisez l’outil de surveillance à exécuter des contrôles :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->
Interrogez tous les paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->
Configurez plusieurs paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->
Journaux
Journalisation des déboguages
Par défaut, la journalisation du débogage est désactivée.
Pour vérifier si la journalisation du débogage est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->
Si debug: 0
est renvoyé, la journalisation du débogage est désactivée.
Pour activer la journalisation du débogage :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->
Journalisation SSL
Par défaut, la journalisation SSL est désactivée :
ssl_logging=0x00
<!--NeedCopy-->
Pour vérifier si la journalisation SSL est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->
Pour activer la journalisation SSL :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->
Seuils d’alerte et seuils critiques
Pour certains de ces plugins de vérification, vous pouvez définir des valeurs seuils d’avertissement et critiques de sorte que si la valeur renvoyée par un plug-in de vérification dépasse les valeurs seuils, une alerte soit générée. Le seuil d’alerte indique un problème potentiel et le seuil critique indique un problème plus grave qui nécessite une attention immédiate. Bien que les valeurs par défaut soient définies pour les seuils d’avertissement et les seuils critiques, vous pouvez ajuster les valeurs de seuil.
Pour interroger les valeurs d’avertissement et de seuil critique par défaut pour tous les contrôles, exécutez la commande xe CLI suivante qui renvoie une liste de tous les contrôles et leurs seuils d’avertissement et critiques associés :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->
Vous pouvez également rechercher les valeurs de seuil pour un contrôle spécifique. Par exemple, pour obtenir les valeurs d’avertissement et de seuil critiques pour le plug-in de vérification check_memory
, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->
Vous pouvez également modifier la valeur par défaut d’un seuil. Par exemple, pour modifier les valeurs de seuil par défaut pour le plug-in de vérification check_memory
, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->
Surveiller les ressources de l’hôte et du dom0 avec SNMP
Remarque :
La fonctionnalité SNMP est disponible pour les clients de XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, voir Licences. Pour effectuer une mise à niveau ou acheter une licence XenServer, visitez le site Web de XenServer.
Avec le rôle d’administrateur de pool, vous pouvez utiliser SNMP pour surveiller à distance les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte. Un gestionnaire SNMP, également appelé système de gestion réseau (NMS), envoie des demandes de requête à un agent SNMP exécuté sur un hôte XenServer. L’agent SNMP répond à ces requêtes en renvoyant les données collectées sur différentes mesures au NMS. Les données qui peuvent être collectées sont définies par des identificateurs d’objets (OID) dans un fichier texte appelé base d’informations de gestion (MIB). Un OID représente une information mesurable spécifique concernant un périphérique réseau, telle que l’utilisation du processeur ou de la mémoire.
Vous pouvez également configurer des traps, qui sont des messages initiés par l’agent qui alertent le NMS qu’un événement spécifique s’est produit sur XenServer. Les requêtes et les traps peuvent être utilisés pour surveiller l’état de vos pools XenServer. Ils sont définis comme des objets mesures et traps et sont identifiés par des OID dans un fichier MIB XENSERVER-MIB.txt
, disponible au téléchargement depuis la page de téléchargements de XenServer. Les tableaux suivants fournissent des informations sur ces objets mesures et traps.
Objets mesures
Vous pouvez demander des informations spécifiques sur vos hôtes XenServer en utilisant les mesures répertoriées dans le tableau suivant. Ces mesures sont utilisées par le gestionnaire SNMP lors de l’envoi de requêtes à un agent SNMP. Vous pouvez ainsi consulter ces données dans votre NMS.
Vous pouvez consulter les données renvoyées par ces objets mesures depuis votre NMS ou depuis l’interface de ligne de commande xe. Pour interroger les objets mesures depuis l’interface de ligne de commande xe, exécutez host-data-source-query
ou vm-data-source-query
et fournissez la source de données RRDD comme valeur pour le paramètre data-source
. Par exemple :
xe host-data-source-query data-source=cpu_avg host=<host UUID>
<!--NeedCopy-->
Remarque :
Par défaut, le NMS envoie des requêtes OID aux agents SNMP via le port 161.
Identifiant d’objet (OID) | Source de données RRDD | Données renvoyées | Type |
---|---|---|---|
.1.3.6.1.4.1.60953.1.1.1.1 | memory |
Mémoire totale Dom0 en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.2 | memory_internal_free |
Dom0 mémoire libre en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.3 | cpu_usage |
Utilisation du processeur Dom0 en pourcentage | Flotteur |
.1.3.6.1.4.1.60953.1.1.1.4 | memory_total_kib |
Mémoire totale de l’hôte en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.5 | memory_free_kib |
Mémoire libre de l’hôte en Mo | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.6 | cpu_avg |
Utilisation du processeur hôte en pourcentage | Flotteur |
.1.3.6.1.4.1.60953.1.1.1.7 | (voir note 1) | Nombre de PCPUs | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.8 | running_vcpus |
Numéro de vCPU en cours d’exécution | Unsigned32 |
.1.3.6.1.4.1.60953.1.1.1.9 | running_domains |
Numéro des machines virtuelles en cours d’exécution | Unsigned32 |
Remarques :
Le nom d’un pCPU est au format
cpu
suivi d’un chiffre. Pour interroger le nombre de PCPUs depuis l’interface de ligne de commande xe, exécutez la commande suivante :
xe host-data-source-list host=<host UUID> | grep -E 'cpu[0-9]+$'
This returns a list of the CPU metrics that match the regular expression
cpu[0-9]+
.
Traps
Les traps sont des alertes envoyées par l’agent SNMP pour avertir le gestionnaire SNMP lorsque certains événements se produisent, ce qui vous permet de surveiller vos hôtes XenServer et d’identifier les problèmes à un stade précoce. Vous pouvez configurer vos paramètres SNMP pour générer un trap lorsqu’une limite est atteinte (par exemple, si l’utilisation du processeur hôte est trop élevée). Lorsqu’un trap est généré, il est envoyé à votre NMS et les champs suivants sont renvoyés dans le cadre de l’objet trap.
Remarque :
Par défaut, l’agent SNMP de l’hôte du coordinateur de pool envoie des traps au NMS via le port UPD 162.
Identifiant d’objet (OID) | Nom du champ | Type | Description |
---|---|---|---|
.1.3.6.1.4.1.60953.1.10.1.1 | operation |
Chaîne | Il peut s’agir de l’une des valeurs suivantes : add ou del . operation est add si un trap est généré par XenServer et envoyé à votre NMS (une alerte est également créée dans XenCenter) ou del si une alerte est détruite (par exemple, si vous rejetez une alerte). |
.1.3.6.1.4.1.60953.1.10.1.2 | ref |
Chaîne | Référence de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.3 | uuid |
Chaîne | UUID de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.4 | name |
Chaîne | Nom de l’objet trap. |
.1.3.6.1.4.1.60953.1.10.1.5 | priority |
Entier | Gravité du trap. Il peut s’agir de l’une des valeurs suivantes 1 : Critique, 2 : Majeur, 3 : Avertissement, 4 : Mineur, 5 : Informations, others : Inconnu. |
.1.3.6.1.4.1.60953.1.10.1.6 | class |
Chaîne | Catégorie du trap généré. Il peut s’agir de l’une des valeurs suivantes : VM , Host , SR , Pool , VMPP , VMSS , PVS_proxy , VDI ou Certificate . |
.1.3.6.1.4.1.60953.1.10.1.7 | obj-uuid |
Chaîne | L’UUID de l’objet xapi des différentes classes du champ class . |
.1.3.6.1.4.1.60953.1.10.1.8 | timestamp |
Chaîne | Heure à laquelle le trap est généré. |
.1.3.6.1.4.1.60953.1.10.1.9 | body |
Chaîne | Informations détaillées sur le domaine name . |
Logiciels requis
-
Tous les hôtes d’un pool doivent exécuter la même version de XenServer et cette version doit contenir le plug-in SNMP.
Remarque :
Si vous ne pouvez pas voir l’onglet SNMP dans XenCenter, cela peut être dû au fait que l’hôte ou un membre du pool n’exécute pas de version de XenServer prenant en charge le SNMP. Mettez à jour l’hôte ou le pool vers la dernière version de XenServer.
-
Le NMS que vous utilisez doit prendre en charge SNMPv2c ou SNMPv3.
-
Votre NMS et XenServer doivent être connectés au réseau.
Contraintes
- Vous pouvez configurer les paramètres SNMP pour l’ensemble d’un pool ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres SNMP pour un hôte individuel d’un pool.
-
Si vous ajoutez un hôte à un pool sur lequel SNMP est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres SNMP du pool au nouvel hôte. Vous devez reconfigurer les paramètres SNMP du pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres SNMP avant de l’ajouter au pool.
Remarque :
Lorsque vous reconfigurez les paramètres SNMP d’un pool après avoir ajouté un nouvel hôte, assurez-vous que l’hôte est opérationnel et qu’il n’est pas en mode de maintenance.
-
Avant d’effectuer une mise à niveau continue de Citrix Hypervisor 8.2 CU1 vers XenServer 8 ou d’appliquer des mises à jour à vos hôtes et pools XenServer, sauvegardez les fichiers de configuration suivants si vous les avez modifiés manuellement auparavant et si vous en avez besoin :
/etc/snmp/snmpd.xs.conf
/etc/sysconfig/snmp
/var/lib/net-snmp/snmpd.conf
- Lorsque l’agent SNMP est hors ligne, aucun trap ne peut être généré. Par exemple, si l’agent SNMP est redémarré ou si le coordinateur du pool est redémarré ou redésigné.
Configurer SNMP à l’aide de l’interface de ligne de commande xe
Vous pouvez configurer SNMP à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration du SNMP à l’aide de XenCenter, consultez la section Surveillance des ressources de l’hôte etdu dom0 avec SNMP.
Objets result
Lors de la configuration de SNMP, toutes les réponses sont renvoyées au format JSON. Si une commande s’exécute correctement, elle renvoie la paire clé-valeur "code": 0
. Certaines commandes (comme la commande get-config
) renvoient un objet JSON imbriqué appelé result
. L’objet JSON result
est également requis pour la commande set-config
utilisée pour mettre à jour la configuration SNMP.
L’objet JSON result
est composé des objets suivants common
, agent
et nmss
:
common
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
enabled |
no (désactiver le service SNMP) ou yes (activer le service SNMP) |
no |
debug_log |
no (désactiver la journalisation du débogage) ou yes (activer la journalisation du débogage) |
no |
max_nmss |
N/A (Ce champ est en lecture seule et indique le nombre maximum de NMS pris en charge) | 1 |
agent
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
v2c |
no (désactiver SNMPv2C) ou yes (activer SNMPv2C) |
yes |
community |
COMMON_STRING_TYPE (voir remarque 1) | public |
v3 |
no (désactiver la v3) ou yes (activer la v3) |
no |
user_name |
COMMON_STRING_TYPE (voir remarque 1) | |
authentication_password |
COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1) | |
authentication_protocol |
MD5 ou SHA
|
|
privacy_password |
COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1) | |
privacy_protocol |
DES ou AES
|
|
engine_id |
N/A (Ce champ est en lecture seule et est généré lorsque l’agent SNMP démarre pour la première fois) |
nmss
Champ | Valeurs autorisées | Valeur par défaut |
---|---|---|
uuid |
UUID NMS (vous le définissez lorsque vous configurez le récepteur de trap NMS et cette valeur doit être cohérente sur tous les hôtes d’un pool) | |
address |
Adresse IPv4 ou nom d’hôte (FQDN) NMS | |
port |
1 à 65535
|
162 |
v2c |
no (désactivez SNMPv2C), yes (activez SNMPv2C), ou prenez en charge SNMPv2C ou v3. |
yes |
community |
COMMON_STRING_TYPE (voir remarque 1) | public |
v3 |
no (désactivez la v3), yes (activez la version 3), ou prenez en charge SNMPv2C ou SNMPv3. |
no |
user_name |
COMMON_STRING_TYPE (voir remarque 1) | |
authentication_password |
COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1) | |
authentication_protocol |
MD5 ou SHA
|
|
privacy_password |
COMMON_STRING_TYPE où longueur >= 8 (voir remarque 1) | |
privacy_protocol |
DES ou AES
|
Remarques :
- COMMON_STRING_TYPE fait référence à une chaîne qui répond aux exigences suivantes :
- Toute combinaison de lettre, de chiffre, de tiret (-), de point (.), de livre (#), de signe arobase (@), de signe égal (=), de deux-points (:) ou de caractères de soulignement (_).
- Longueur comprise entre 6 et 32 pouces inclus.
- Les mots de passe ne sont stockés en texte brut dans aucun fichier de configuration de XenServer. Elles sont converties en clé localisée et stockées. La commande
get-config
affiche le mot de passe sous la forme d’une constante cachée composée d’astérisques (*).
Configuration du service SNMP
Obtenez l’état du service SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=status
<!--NeedCopy-->
Démarrez, arrêtez ou redémarrez le service SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=<operation>
<!--NeedCopy-->
où l’opération est start
, stop
ou restart
.
Obtenez les détails de configuration SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=get-config
<!--NeedCopy-->
En cas de succès, cette commande renvoie la paire clé-valeur "code": 0
et l’objet JSON result
contenant les détails de configuration du service SNMP. Par exemple :
"code": 0,
"result": {
"common": {
"enabled": "no",
"debug_log": "no",
"max_nmss": 1
},
"agent": {
"v2c": "yes",
"v3": "no",
"community": "public",
"user_name": "",
"authentication_password": "",
"authentication_protocol": "",
"privacy_password": "",
"privacy_protocol": "",
"engine_id": "<engine_id>"
},
"nmss": []
}
<!--NeedCopy-->
Copiez l’objet JSON result
dans votre éditeur de texte préféré et supprimez tous les caractères de nouvelle ligne (\n) du fichier. Mettez à jour les champs avec les détails de votre configuration SNMP. Configurez votre NMS en vous référant à la documentation de votre NMS et en spécifiant des valeurs pour les champs requis pour l’objet nmss
. Pour plus d’informations, reportez-vous aux objets répertoriés ci-dessus.
Pour configurer le service SNMP, exécutez la commande set-config
et fournissez l’objet JSON result
modifié en tant que valeur de paramètre au paramètre args:config
.
Définissez la configuration SNMP :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=set-config args:config='<result>'
<!--NeedCopy-->
où result est l’objet JSON result
renvoyé par la commande get-config
que vous avez copiée et modifiée.
Remarque :
Pour configurer SNMP pour l’ensemble d’un pool, vous devez exécuter la commande
set-config
pour chaque hôte du pool.
Si les modifications de configuration sont réussies, la commande renvoie la paire clé-valeur "code": 0
. Si les modifications de configuration échouent, la commande set-config
renvoie l’une des paires clé-valeur suivantes, qui indiquent qu’une erreur s’est produite :
-
"code": 1
: chaîne d’erreur courante. Par exemple, une exception inconnue. -
"code": 2
: chaîne d’erreur (le paramètre est manquant). -
"code": 3
: renvoie un objetmessage
sous la forme d’une liste où chaque élément est au format[field_path, key, value, error string]
.
Vous pouvez également envoyer un trap SNMP de test à votre NMS pour vérifier que les informations du récepteur de trap spécifiées sont correctes.
Envoyez un trap SNMP de test :
xe host-call-plugin host-uuid=<host-uuid> plugin=snmp fn=send-test-trap args:config='{"nmss":[{"uuid":"<uuid>","address":"<address>","port":162,"v2c":"yes","v3":"no","community":"public","user_name":"<user_name>","authentication_password":"<authentication_password>","authentication_protocol":"<authentication_protocol>","privacy_password":"<privacy_password>","privacy_protocol":"<privacy_protocol>"}]}'
<!--NeedCopy-->
Cette commande envoie un trap de test à votre NMS avec le msg_name
TEST_TRAP
et le msg_body
This is a test trap from XenServer pool "<pool name>" to verify the NMS Trap Receiver configuration.
.
Si vous ne recevez pas le trap de test, vérifiez à nouveau votre configuration SNMP. En cas d’échec, la commande send-test-trap
renvoie également l’une des paires clé-valeur suivantes, qui indiquent qu’une erreur s’est produite :
-
"code": 1
: chaîne d’erreur courante. Par exemple, une exception inconnue. -
"code": 2
: chaîne d’erreur (le paramètre est manquant). -
"code": 3
: renvoie un objetmessage
sous la forme d’une liste où chaque élément est au format[field_path, key, value, error string]
. -
"code": 4
: renvoie un objetmessage
sous la forme d’une liste où chaque élément est au format[nms address, nms port, error string]
.
Dans cet article
- Surveiller les performances de XenServer
- Utiliser des RRD
- Alertes
- Configuration des alertes par e-mail
- Champs et balises personnalisés
- Recherches personnalisées
- Déterminer le débit des adaptateurs de bus physiques
- Surveillez les ressources de l’hôte et du dom0 avec NRPE
- Surveiller les ressources de l’hôte et du dom0 avec SNMP