XenServer

NRPE로 host 및 dom0 리소스 모니터링

메모:

NRPE 기능은 XenServer Premium 또는 평가판 Edition 고객이 사용할 수 있습니다. XenServer 라이센스에 대한 자세한 내용은 다음을 참조하십시오. 라이센스. XenServer 라이센스를 업그레이드하거나 얻으려면 XenServer 웹 사이트.

풀 관리자 역할의 사용자는 NRPE(Nagios Remote Plugin Executor)를 지원하는 타사 모니터링 도구를 사용하여 XenServer 호스트 및 dom0(호스트의 제어 도메인)에서 사용하는 리소스를 모니터링할 수 있습니다.

다음 check 플러그인을 사용하여 host 및 dom0 리소스를 모니터링할 수 있습니다.

메트릭 NRPE 검사 이름 설명 기본 경고 임계값 기본 임계 임계값 반환된 성능 데이터
호스트 CPU 로드 check_host_load 호스트의 물리적 CPU당 현재 로드를 가져오고 확인하며, 여기서 load는 실행 중이거나 실행 가능한 상태의 vCPU 수를 나타냅니다. 3 4 호스트 CPU의 현재 시스템 로드(호스트 물리적 CPU의 평균 로드를 취하여 계산됨).
호스트 CPU 사용량(%) check_host_cpu 호스트의 현재 평균 전체 CPU 사용량을 가져오고 확인합니다. 80% 90% 현재 사용 가능한 호스트 CPU의 백분율과 사용 중인 백분율입니다.
호스트 메모리 사용량(%) check_host_memory 호스트의 현재 메모리 사용량을 가져오고 확인합니다. 80% 90% 현재 사용 가능한 호스트 메모리의 백분율과 사용 중인 백분율입니다.
호스트 vGPU 사용량(%) check_vgpu 호스트에서 현재 실행 중인 모든 Nvidia vGPU 사용량을 가져오고 확인합니다. 80% 90% 현재 사용 가능한 실행 중인 vGPU의 비율과 사용 중인 비율입니다.
호스트 vGPU 메모리 사용량(%) check_vgpu_memory 호스트에서 현재 실행 중인 모든 Nvidia vGPU 메모리 사용량(공유 메모리 및 그래픽 메모리 포함)을 가져오고 확인합니다. 80% 90% 현재 사용 가능한 실행 중인 vGPU 메모리(공유 메모리 및 그래픽 메모리 포함)의 백분율과 사용 중인 백분율입니다.
Dom0 CPU 로드 check_load dom0의 CPU당 현재 시스템 로드 평균을 가져오고 확인하며, 여기서 load는 실행 중이거나 실행 가능한 상태의 프로세스 수를 나타냅니다. 2.7,2.6,2.5 3.2,3.1,3 지난 1분, 5분, 15분의 평균을 사용하여 계산된 호스트 CPU 로드 데이터입니다.
Dom0 CPU 사용량(%) check_cpu dom0의 현재 평균 전체 CPU 사용량을 가져오고 확인합니다. 80% 90% dom0의 전체 평균 CPU 사용량(백분율)입니다.
Dom0 메모리 사용량(%) check_memory dom0의 현재 메모리 사용량을 가져오고 확인합니다. 80% 90% 현재 사용 가능한 dom0 메모리의 백분율과 사용 중인 백분율입니다.
Dom0 무료 스왑 (%) check_swap dom0의 현재 스왑 사용량을 가져오고 확인합니다. 20% 10% dom0에서 현재 사용 가능한 MB의 백분율입니다.
Dom0 루트 파티션 여유 공간(%) check_disk_root dom0의 현재 루트 파티션 사용량을 가져오고 확인합니다. 20% 10% dom0 루트 파티션에서 현재 사용 가능한 MB의 백분율입니다.
Dom0 로그 파티션 여유 공간(%) check_disk_log dom0의 현재 로그 파티션 사용량을 가져오고 확인합니다. 20% 10% dom0 로그 파티션에서 현재 사용 가능한 MB의 백분율입니다.
Toolstack 상태 check_xapi XenServer 관리 도구 스택(XAPI라고도 함)의 상태를 가져오고 확인합니다.     XAPI의 가동 시간 경과(초)입니다.
다중 경로 상태 check_multipath 저장소 경로의 상태를 가져오고 확인합니다.     스토리지 경로의 상태입니다. 그래 모든 경로가 활성 상태임을 나타냅니다. 경고 일부 경로가 실패했지만 둘 이상의 경로가 활성 상태임을 나타냅니다. 비판적인 활성 경로가 하나만 있거나 모든 경로가 실패했음을 나타냅니다. 알려지지 않은 호스트 다중 경로가 비활성화되어 있고 경로의 상태를 가져올 수 없음을 나타냅니다.

NRPE는 dom0에서 실행되며 TCP 포트(기본값) 5666에서 모니터링 도구의 검사 실행 요청을 수신하는 온-프레미스 서비스입니다. 요청이 도착하면 NRPE는 요청을 구문 분석하고 구성 파일에서 매개변수의 세부 정보를 포함하는 해당 check 명령을 찾은 다음 실행합니다. 검사 결과는 모니터링 도구로 전송되며, 모니터링 도구는 과거 검사 결과를 저장하고 과거 성능 데이터를 보여주는 그래프를 제공합니다.

사전 요구 사항

NRPE를 사용하여 호스트 및 dom0 리소스를 모니터할 수 있으려면 사용 중인 모니터링 도구가 다음 사전 요구 사항을 충족해야 합니다.

  • 모니터링 도구는 NRPE 버전 4.1.0과 호환되어야 합니다.
  • NRPE와 모니터링 도구 간의 통신을 허용하려면 모니터링 도구가 암호를 사용하여 TLS 1.2를 지원해야 합니다 ECDHE-RSA-AES256-GCM-SHA384 그리고 ECDHE-RSA-AES128-GCM-SHA256이고 EC 곡선은 다음과 같습니다. SECP384R1.

제약 조건

  • 전체 풀 또는 풀의 일부가 아닌 독립형 호스트에 대해 NRPE 설정을 구성할 수 있습니다. 현재 풀의 개별 호스트에 대한 NRPE 설정을 구성할 수 없습니다.
  • NRPE가 이미 사용되도록 설정되고 구성된 풀에 호스트를 추가하는 경우 XenCenter는 풀의 NRPE 설정을 새 호스트에 자동으로 적용하지 않습니다. 새 호스트를 추가한 후 풀에서 NRPE 설정을 재구성하거나 풀에 추가하기 전에 동일한 NRPE 설정으로 새 호스트를 구성해야 합니다.

    메모:

    새 호스트를 추가한 후 풀에서 NRPE 설정을 재구성할 때 호스트가 실행 중인지 확인합니다.

  • NRPE가 활성화되고 구성된 풀에서 호스트가 제거되는 경우 XenCenter는 호스트나 풀의 NRPE 설정을 변경하지 않습니다.

xe CLI를 사용하여 NRPE 구성

xe CLI 또는 XenCenter를 사용하여 NRPE를 구성할 수 있습니다. XenCenter를 사용하여 NRPE를 구성하는 방법에 대한 자세한 내용은 다음을 참조하십시오. NRPE를 사용하여 호스트 및 dom0 리소스 모니터링.

NRPE에 대한 구성을 변경한 후 다음을 사용하여 NRPE 서비스를 다시 시작합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=restart
<!--NeedCopy-->

NRPE 활성화

NRPE는 XenServer에서 기본적으로 비활성화되어 있습니다. 호스트의 제어 도메인(dom0)에서 NRPE를 활성화하려면 xe CLI에서 다음 명령을 실행합니다.

  1. 모니터링하려는 호스트의 호스트 UUID를 가져옵니다.

    xe host-list

  2. 호스트에서 NRPE를 활성화합니다.

    xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=enable

    작업이 성공적으로 실행되면 이 명령은 다음을 출력합니다 성공. XenServer가 다시 시작되면 NRPE가 자동으로 시작됩니다.

NRPE를 중지, 시작, 다시 시작 또는 비활성화하려면 다음을 수행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=<operation>
<!--NeedCopy-->

어디 수술 다음과 같음 멈추다, 시작하다, 다시 시작할또는 비활성화.

서버 모니터링

NRPE 데몬과 통신할 수 있는 IP 주소 또는 호스트 이름의 쉼표로 구분된 목록입니다. 비트 마스크가 있는 네트워크 주소(예: 192.168.1.0/24)도 지원됩니다.

모니터링 서버의 현재 목록을 봅니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:allowed_hosts
<!--NeedCopy-->

모니터링 도구가 검사를 실행하도록 허용합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname>
<!--NeedCopy-->

모든 NRPE 설정을 쿼리합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config
<!--NeedCopy-->

여러 NRPE 설정을 구성합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:allowed_hosts=<IP address or hostname> args:ssl_logging=<SSL log level> args:debug=<debug log level>
<!--NeedCopy-->

로그

디버그 로깅

기본적으로 디버그 로깅은 비활성화되어 있습니다.

디버그 로깅이 활성화되어 있는지 확인하려면 다음 명령을 실행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:debug
<!--NeedCopy-->

디버그: 0 가 반환되면 디버그 로깅이 비활성화됩니다.

디버그 로깅을 활성화하려면:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:debug=1
<!--NeedCopy-->

SSL 로깅

기본적으로 SSL 로깅은 비활성화되어 있습니다.

  ssl_logging=0x00
<!--NeedCopy-->

SSL 로깅을 사용할 수 있는지 확인하려면 다음 명령을 실행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-config args:ssl_logging
<!--NeedCopy-->

SSL 로깅을 활성화하려면:

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-config args:ssl_logging=0x2f
<!--NeedCopy-->

경고 및 위험 임계값

이러한 검사 플러그인 중 일부의 경우 검사 플러그인에서 반환된 값이 임계값을 초과하면 경고가 생성되도록 경고 및 위험 임계값을 설정할 수 있습니다. 경고 임계값은 잠재적인 문제를 나타내고 위험 임계값은 즉각적인 주의가 필요한 더 심각한 문제를 나타냅니다. 경고 및 위험 임계값에 대해 기본값이 설정되지만 임계값을 조정할 수 있습니다.

모든 검사에 대한 기본 경고 및 위험 임계값을 쿼리하려면 모든 검사와 관련 경고 및 위험 임계값 목록을 반환하는 다음 xe CLI 명령을 실행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold
<!--NeedCopy-->

특정 검사에 대한 임계값을 쿼리할 수도 있습니다. 예를 들어, 에 대한 경고 및 위험 임계값을 가져오려면 check_memory check plugin에서 다음 xe CLI 명령을 실행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=get-threshold args:check_memory
<!--NeedCopy-->

임계값의 기본값을 변경할 수도 있습니다. 예를 들어, 에 대한 기본 임계값을 변경하려면 check_memory check plugin에서 다음 xe CLI 명령을 실행합니다.

  xe host-call-plugin host-uuid=<host uuid> plugin=nrpe fn=set-threshold args:check_memory args:w=75 args:c=85
<!--NeedCopy-->
NRPE로 host 및 dom0 리소스 모니터링