Surveillez les ressources host et dom0 avec NRPE
Remarque :
La fonctionnalité NRPE est disponible pour les clients XenServer Premium ou Trial Edition. Pour plus d’informations sur les licences XenServer, consultez Licences. Pour mettre à niveau ou pour obtenir une licence XenServer, rendez-vous sur le Site web de XenServer.
Les utilisateurs disposant du rôle Pool Admin peuvent utiliser n’importe quel outil de surveillance tiers prenant en charge le Nagios Remote Plugin Executor (NRPE) pour surveiller les ressources consommées par votre hôte XenServer et dom0, le domaine de contrôle de votre hôte.
Vous pouvez utiliser les plugins de vérification suivants pour surveiller les ressources host et dom0 :
| Métrique | Nom de la vérification NRPE | Description | Seuil d’avertissement par défaut | Seuil critique par défaut | Données de performance renvoyées |
|---|---|---|---|---|---|
| Charge du processeur de l’hôte | check_host_load | Obtient et vérifie la charge actuelle par processeur physique de l’hôte, où la charge fait référence au nombre de vCPU en cours d’exécution ou exécutables. | 3 | 4 | Charge système actuelle du processeur de l’hôte (calculée en prenant la charge moyenne du processeur physique de l’hôte). |
| Utilisation du processeur de l’hôte (%) | check_host_cpu | Obtient et vérifie l’utilisation moyenne actuelle du processeur global de l’hôte. | 80 % | 90 % | Pourcentage de CPU hôte actuellement libre et pourcentage utilisé. |
| Utilisation de la mémoire de l’hôte (%) | check_host_memory | Obtient et vérifie l’utilisation actuelle de la mémoire de l’hôte. | 80 % | 90 % | Pourcentage de la mémoire hôte actuellement disponible et pourcentage utilisé. |
| Utilisation du vGPU de l’hôte (%) | check_vgpu | Obtient et vérifie toute l’utilisation actuelle de Nvidia vGPU de l’hôte. | 80 % | 90 % | Pourcentage de vGPU en cours d’exécution actuellement libre et pourcentage utilisé. |
| Utilisation de la mémoire vGPU de l’hôte (%) | check_vgpu_memory | Obtient et vérifie toute l’utilisation actuelle de la mémoire Nvidia vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) de l’hôte. | 80 % | 90 % | Pourcentage de mémoire vGPU en cours d’exécution (y compris la mémoire partagée et la mémoire graphique) actuellement disponible et pourcentage utilisé. |
| Charge CPU Dom0 | check_load | Obtient et vérifie la charge moyenne actuelle du système par processeur de dom0, où la charge fait référence au nombre de processus dans un état en cours d’exécution ou exécutable. | 2.7,2.6,2.5 | 3.2,3.1,3 | Les données de charge du processeur de l’hôte sont calculées en prenant la moyenne des 1, 5 et 15 dernières minutes. |
| Utilisation du processeur Dom0 (%) | check_cpu | Obtient et vérifie l’utilisation moyenne actuelle du processeur global de dom0. | 80 % | 90 % | Utilisation globale moyenne du processeur de dom0 en pourcentage. |
| Utilisation de la mémoire dom0 (%) | check_memory | Obtient et vérifie l’utilisation actuelle de la mémoire de dom0. | 80 % | 90 % | Pourcentage de mémoire dom0 actuellement libre et pourcentage utilisé. |
| Dom0 Échange gratuit (%) | check_swap | Obtient et vérifie l’utilisation actuelle de l’échange dom0. | 20% | 10 % | Le pourcentage de Mo sur dom0 qui est actuellement libre. |
| Dom0 Partition racine Espace libre (%) | check_disk_root | Obtient et vérifie l’utilisation actuelle de la partition racine de dom0. | 20% | 10 % | Pourcentage de Mo sur la partition racine dom0 qui est actuellement libre. |
| Dom0 Log Partition Espace libre (%) | check_disk_log | Obtient et vérifie l’utilisation actuelle de la partition de journal de dom0. | 20% | 10 % | Pourcentage de Mo sur la partition de journal dom0 qui est actuellement libre. |
| État de la pile d’outils | check_xapi | Obtient et vérifie l’état de la pile d’outils de gestion XenServer (également appelée XAPI). | Le temps de fonctionnement écoulé de XAPI en secondes. | ||
| État des chemins d’accès multiples | check_multipath | Obtient et vérifie l’état des chemins de stockage. | L’état des chemins de stockage. D’ACCORD indique que tous les chemins sont actifs, AVERTISSEMENT indique que certains chemins ont échoué mais que plusieurs chemins sont actifs, CRITIQUE indique qu’il n’y a qu’un seul chemin actif ou que tous les chemins ont échoué, INCONNU indique que le multipathing de l’hôte est désactivé et que l’état des chemins d’accès ne peut pas être récupéré. |
NRPE est un service sur site qui s’exécute dans dom0 et écoute sur le port TCP (par défaut) 5666 pour les demandes d’exécution de vérification à partir d’un outil de surveillance. Une fois qu’une demande est arrivée, NRPE l’analyse, trouve la commande check correspondante, y compris les détails du paramètre dans le fichier de configuration, puis l’exécute. Le résultat de la vérification est envoyé à l’outil de surveillance, qui stocke les résultats des vérifications précédentes et fournit un graphique montrant les données de performances historiques.
Prérequis
Pour pouvoir utiliser NRPE pour surveiller les ressources host et dom0, l’outil de supervision que vous utilisez doit répondre aux prérequis suivants :
- L’outil de surveillance doit être compatible avec la version 4.1.0 du NRPE.
- Pour permettre la communication entre le NRPE et l’outil de surveillance, celui-ci doit prendre en charge TLS 1.2 avec les chiffrements
ECDHE-RSA-AES256-GCM-SHA384etECDHE-RSA-AES128-GCM-SHA256, et la courbe EC estSECP384R1.
Contraintes
- Vous pouvez configurer les paramètres NRPE pour l’ensemble d’un pool ou pour un hôte autonome qui ne fait pas partie d’un pool. Actuellement, vous ne pouvez pas configurer les paramètres NRPE pour un hôte individuel dans un pool.
-
Si vous ajoutez un hôte à un pool sur lequel NRPE est déjà activé et configuré, XenCenter n’applique pas automatiquement les paramètres NRPE du pool au nouvel hôte. Vous devez reconfigurer les paramètres NRPE sur le pool après avoir ajouté le nouvel hôte ou configurer le nouvel hôte avec les mêmes paramètres NRPE avant de l’ajouter au pool.
Remarque :
Lorsque vous reconfigurez les paramètres NRPE sur un pool après l’ajout d’un nouvel hôte, assurez-vous que l’hôte est opérationnel.
- Si un hôte est supprimé d’un pool avec NRPE activé et configuré dessus, XenCenter ne modifie pas les paramètres NRPE sur l’hôte ou le pool.
Configurer NRPE à l’aide de l’interface de ligne de commande xe
Vous pouvez configurer NRPE à l’aide de l’interface de ligne de commande xe ou de XenCenter. Pour plus d’informations sur la configuration de NRPE à l’aide de XenCenter, consultez Surveillance des ressources host et dom0 avec NRPE.
Après avoir apporté des modifications de configuration à NRPE, redémarrez le service NRPE à l’aide de :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->
Activer NRPE
NRPE est désactivé par défaut dans XenServer. Pour activer NRPE sur le domaine de contrôle d’un hôte (dom0), exécutez les commandes suivantes dans l’interface de ligne de commande xe :
-
Obtenez l’UUID de l’hôte que vous souhaitez surveiller :
xe host-list -
Activez NRPE sur l’hôte :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enableSi l’opération s’exécute correctement, cette commande génère
Succès. Lorsque XenServer redémarre, NRPE démarre automatiquement.
Pour arrêter, démarrer, redémarrer ou désactiver NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->
où opération est arrêter, commencer, redémarrerou désactiver.
Surveillance des serveurs
Il s’agit d’une liste d’adresses IP ou de noms d’hôte séparés par des virgules qui sont autorisés à communiquer avec le démon NRPE. Adresses réseau avec un masque de bits (par exemple 192.168.1.0/24) sont également pris en charge.
Consultez la liste actuelle des serveurs de surveillance :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->
Autorisez l’outil de surveillance à exécuter des vérifications :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->
Interrogez tous les paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->
Configurez plusieurs paramètres NRPE :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->
Journaux
Journalisation de débogage
Par défaut, la journalisation de débogage est désactivée.
Pour vérifier si la journalisation de débogage est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->
Si débogage : 0 est renvoyé, la journalisation de débogage est désactivée.
Pour activer la journalisation de débogage :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->
Journalisation SSL
Par défaut, la journalisation SSL est désactivée :
ssl_logging=0x00
<!--NeedCopy-->
Pour vérifier si la journalisation SSL est activée, exécutez la commande suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->
Pour activer la journalisation SSL :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->
Seuils d’alerte et seuils critiques
Pour certains de ces plug-ins de vérification, vous pouvez définir des valeurs de seuil d’avertissement et de critique de sorte que si la valeur renvoyée par un plug-in de vérification dépasse les valeurs de seuil, une alerte est générée. Le seuil d’avertissement indique un problème potentiel et le seuil critique indique un problème plus grave qui nécessite une attention immédiate. Bien que des valeurs par défaut soient définies pour les seuils d’avertissement et critique, vous pouvez ajuster les valeurs de seuil.
Pour interroger les valeurs d’avertissement et de seuil critique par défaut pour toutes les vérifications, exécutez la commande CLI xe suivante qui renvoie une liste de toutes les vérifications et de leurs seuils d’avertissement et critiques associés :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->
Vous pouvez également interroger les valeurs de seuil d’une vérification spécifique. Par exemple, pour obtenir les valeurs d’avertissement et de seuil critique pour le check_memory check plugin, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->
Vous pouvez également modifier la valeur par défaut d’un seuil. Par exemple, pour modifier les valeurs de seuil par défaut de la commande check_memory check plugin, exécutez la commande xe CLI suivante :
xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->