Citrix Hypervisor

클러스터된 풀 문제 해결Troubleshoot clustered pools

중요:

Citrix Hypervisor 8.2 누적 업데이트 1은 2025년 6월 25일에 수명이 종료됩니다. 원활한 전환과 지속적인 지원을 위해 지금 XenServer 8로의 업그레이드를 계획하십시오. 자세한 내용은 업그레이드.

Citrix Virtual Apps and Desktops 라이센스 파일을 사용하여 Citrix Hypervisor 8.2 누적 업데이트 1 호스트에 라이센스를 부여하는 경우 이러한 라이센스 파일은 XenServer 8과 호환되지 않습니다. 업그레이드하기 전에 XenServer 8에서 사용할 XenServer Premium Edition 소켓 라이센스 파일을 얻어야 합니다. 이러한 소켓 라이센스 파일은 Citrix 워크로드를 실행하기 위한 Citrix for Private Cloud, Citrix Universal Hybrid Multi-Cloud, Citrix Universal MSP 및 Citrix Platform License 구독의 자격으로 사용할 수 있습니다. 아직 이러한 새로운 서브스크립션으로 전환하지 않은 Citrix 고객은 XenServer Premium Edition 소켓 라이센스 10,000개에 대한 무료 프로모션에 참여를 요청할 수 있습니다. 자세한 내용은 XenServer 서버.

업그레이드하기 전에 XenServer 8에 대한 호환 라이센스를 얻지 못한 경우 호스트를 업그레이드할 때 90일 평가판으로 되돌아갑니다. 평가판은 Premium Edition과 동일한 기능을 제공하지만 몇 가지 제한 사항이 있습니다. 자세한 내용은 XenServer 8 라이센스 개요.

GFS2를 사용하여 공유 블록 스토리지를 씬 프로비저닝하는 Citrix Hypervisor 풀은 클러스터링됩니다. 이러한 풀은 공유 파일 기반 스토리지 또는 공유 블록 스토리지와 함께 LVM을 사용하는 풀과 다르게 동작합니다. 따라서 Citrix Hypervisor 클러스터 풀 및 GFS2 환경에서 발생할 수 있는 몇 가지 특정 문제가 있습니다.

다음 정보를 사용하여 이 기능을 사용할 때 발생할 수 있는 사소한 문제를 해결하십시오.

모든 호스트가 서로 ping을 보낼 수 있지만 클러스터를 만들 수는 없습니다. 왜?

클러스터링 메커니즘은 특정 포트를 사용합니다. 호스트가 이러한 포트에서 통신할 수 없는 경우(다른 포트에서 통신할 수 있더라도) 풀에 대해 클러스터링을 사용하도록 설정할 수 없습니다.

풀의 호스트가 다음 포트에서 통신할 수 있는지 확인합니다.

  • TCP: 8892, 8896, 21064
  • UDP: 5404, 5405(멀티캐스트 아님)

풀의 호스트 간에 방화벽 또는 이와 유사한 방화벽이 있는 경우 이러한 포트가 열려 있는지 확인합니다.

이전에 풀에서 HA를 구성한 경우 클러스터링을 사용하도록 설정하기 전에 HA를 사용하지 않도록 설정합니다.

새 호스트를 기존 클러스터된 풀에 가입시키려고 할 때 오류가 발생하는 이유는 무엇입니까?

풀에서 클러스터링을 사용하는 경우 모든 풀 멤버 자격 변경은 성공하기 전에 클러스터의 모든 구성원이 동의해야 합니다. 클러스터 멤버에 연결할 수 없는 경우 클러스터 멤버 자격을 변경하는 작업(예: host add 또는 host remove)이 실패합니다.

클러스터된 풀에 새 호스트를 추가하려면:

  1. 모든 호스트가 온라인 상태이고 연락할 수 있는지 확인합니다.

  2. 풀의 호스트가 다음 포트에서 통신할 수 있는지 확인합니다.

    • TCP: 8892, 8896, 21064
    • UDP: 5404, 5405(멀티캐스트 아님)
  3. 가입 호스트에 풀의 클러스터 네트워크에 가입하는 NIC에 할당된 IP 주소가 있는지 확인합니다.

  4. 새 호스트가 클러스터된 풀에 가입하려고 할 때 풀의 호스트가 오프라인 상태인지 확인합니다.

  5. 오프라인 호스트를 복구할 수 없는 경우 비활성으로 표시하여 클러스터에서 제거합니다. 자세한 내용은 클러스터된 풀의 호스트가 오프라인 상태이며 복구할 수 없습니다. 클러스터에서 호스트를 제거하려면 어떻게 해야 합니까?

클러스터된 풀의 일부 멤버가 클러스터에 자동으로 가입하지 않는 경우 어떻게 해야 하나요?

이 문제는 클러스터된 풀의 구성원이 동기화되지 않기 때문에 발생할 수 있습니다.

클러스터된 풀의 멤버를 다시 동기화하려면 다음 명령을 사용합니다.

  xe cluster-pool-resync cluster-uuid=<cluster_uuid>

문제가 지속되면 GFS2 SR을 다시 연결해 볼 수 있습니다. xe CLI를 사용하거나 XenCenter를 통해 이 작업을 수행할 수 있습니다.

xe CLI를 사용하여 GFS2 SR을 다시 연결합니다.

  1. 풀에서 GFS2 SR을 분리합니다. 각 호스트에서 xe CLI 명령을 실행합니다 xe pbd-unplug uuid=&lt;uuid_of_pbd&gt;.

  2. 다음 명령을 사용하여 클러스터된 풀을 사용하지 않도록 설정합니다 xe 클러스터 풀 파괴 클러스터 uuid=&lt;cluster_uuid&gt;

    앞의 명령이 실패하면 다음을 실행하여 클러스터된 풀을 강제로 사용하지 않도록 설정할 수 있습니다 xe cluster-host-force-destroy uuid=&lt;cluster_host&gt; 풀의 모든 호스트에서.

  3. 다음 명령을 사용하여 클러스터된 풀을 다시 사용하도록 설정합니다. xe cluster-pool-create network-uuid={\[--lt--]}network_uuid&gt; [클러스터 스택=cluster_stack\] \[토큰 시간 초과=token_timeout\] [토큰 시간 초과 계수=token_timeout_coefficient]

  4. 다음 명령을 실행하여 GFS2 SR을 다시 연결합니다. xe pbd 플러그 uuid=&lt;uuid_of_pbd&gt; 각 호스트에서.

또는 XenCenter를 사용하여 GFS2 SR을 다시 연결하려면 다음을 수행합니다.

  1. 수영장에서 보관 탭에서 GFS2 SR을 마우스 오른쪽 버튼으로 클릭하고 떼다….
  2. 도구 모음에서 풀 > 속성.
  3. 안에 클러스터링 탭에서 선택 취소 클러스터링 사용.
  4. 클릭 그래 을 클릭하여 변경 사항을 적용합니다.
  5. 도구 모음에서 풀 > 속성.
  6. 안에 클러스터링 탭에서 클러스터링 사용 을 클릭하고 클러스터링에 사용할 네트워크를 선택합니다.
  7. 클릭 그래 을 클릭하여 변경 사항을 적용합니다.
  8. 수영장에서 보관 탭에서 GFS2 SR을 마우스 오른쪽 버튼으로 클릭하고 수리.

호스트가 자체 울타리를 설치했는지 어떻게 알 수 있나요?

호스트가 자체 펜싱된 경우 다시 시작될 때 클러스터에 다시 가입했을 수 있습니다. 호스트가 자체 펜싱 및 복구되었는지 확인하려면 다음을 확인할 수 있습니다. /var/opt/xapi-clusterd/부팅 시간 파일을 클릭하여 호스트가 시작된 시간을 확인합니다. 파일에 예상하지 못한 시작 시간이 있는 경우 호스트는 자체 차단된 것입니다.

호스트가 오프라인 상태인 이유는 무엇인가요? 어떻게 복구할 수 있습니까?

호스트가 오프라인으로 전환되는 데에는 여러 가지 이유가 있을 수 있습니다. 이유에 따라 호스트를 복구하거나 복구하지 않을 수 있습니다.

호스트가 오프라인 상태가 되는 이유는 다음과 같으며 호스트를 복구하여 해결할 수 있습니다.

  • 클린 셧다운
  • 강제 종료
  • 일시적인 정전
  • 재부팅

호스트가 오프라인 상태가 되는 이유는 다음과 같습니다.

  • 영구적인 호스트 하드웨어 오류
  • 영구적인 호스트 전원 공급 장치 장애
  • 네트워크 파티션
  • 네트워크 스위치 실패

이러한 문제는 하드웨어를 교체하거나 장애가 발생한 호스트를 비활성으로 표시하여 해결할 수 있습니다.

클러스터된 풀의 호스트가 오프라인 상태이며 복구할 수 없습니다. 클러스터에서 호스트를 제거하려면 어떻게 해야 합니까?

클러스터에 호스트를 잊어버리도록 지시할 수 있습니다. 이 작업은 클러스터에서 호스트를 영구적으로 제거하고 쿼럼에 필요한 라이브 호스트 수를 줄입니다.

복구할 수 없는 호스트를 제거하려면 다음 명령을 사용합니다.

  xe host-forget uuid=<host_uuid>

이 명령은 클러스터에서 호스트를 영구적으로 제거하고 쿼럼에 필요한 라이브 호스트 수를 줄입니다.

메모:

호스트가 오프라인 상태가 아닌 경우 이 명령으로 인해 데이터가 손실될 수 있습니다. 명령을 계속 진행하기 전에 확실한지 확인하라는 메시지가 표시됩니다.

호스트가 비활성으로 표시되면 클러스터에 다시 추가할 수 없습니다. 이 호스트를 클러스터에 다시 추가하려면 호스트에 Citrix Hypervisor를 새로 설치해야 합니다.

죽은 것으로 표시된 호스트를 수리했습니다. 내 클러스터에 다시 추가하려면 어떻게 해야 합니까?

비활성으로 표시된 Citrix Hypervisor 호스트는 클러스터에 다시 추가할 수 없습니다. 이 시스템을 클러스터에 다시 추가하려면 XenServer를 새로 설치해야 합니다. 이 새로 설치는 클러스터에 새 호스트로 표시됩니다.

클러스터가 쿼럼을 계속 잃고 호스트가 계속 펜싱을 하는 경우 어떻게 해야 합니까?

클러스터에 있는 하나 이상의 Citrix Hypervisor 호스트가 쿼럼을 지속적으로 잃고 얻음으로 인해 펜스 루프에 빠지면 를 사용하여 호스트를 부팅할 수 있습니다. nocluster 커널 명령줄 인수. 호스트의 물리적 또는 직렬 콘솔에 연결하고 grub에서 부팅 인수를 편집합니다.

본보기:

  /boot/grub/grub.cfg
  menuentry 'XenServer' {
          search --label --set root root-oyftuj
          multiboot2 /boot/xen.gz dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G console=vga vga=mode-0x0311
          module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable xencons=hvc console=hvc0 console=tty0 quiet vga=785 splash plymouth.ignore-serial-consoles nocluster
          module2 /boot/initrd-4.4-xen.img
  }
  menuentry 'Citrix Hypervisor (Serial)' {
          search --label --set root root-oyftuj
          multiboot2 /boot/xen.gz com1=115200,8n1 console=com1,vga dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G
          module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable console=tty0 xencons=hvc console=hvc0 nocluster
          module2 /boot/initrd-4.4-xen.img
  }
<!--NeedCopy-->

클러스터된 풀에서 풀 마스터가 다시 시작되면 어떻게 되나요?

대부분의 경우 클러스터된 풀에서 풀 마스터가 종료되거나 다시 시작될 때의 동작은 다른 풀 멤버가 종료되거나 다시 시작될 때의 동작과 동일합니다.

호스트를 종료하거나 다시 시작하는 방법은 클러스터된 풀의 쿼럼에 영향을 줄 수 있습니다. 쿼럼에 대한 자세한 내용은 다음을 참조하십시오. 쿼럼.

동작의 유일한 차이점은 풀에서 HA를 사용하도록 설정했는지 여부에 따라 달라집니다.

  • HA가 활성화된 경우 새 마스터가 선택되고 일반 서비스가 유지됩니다.
  • HA가 활성화되지 않은 경우 풀에 대한 마스터가 없습니다. 나머지 호스트에서 실행 중인 VM은 계속 실행됩니다. 대부분의 관리 작업은 마스터가 다시 시작될 때까지 사용할 수 없습니다.

클러스터된 풀의 호스트가 강제로 종료된 후 내 풀이 사라진 이유는 무엇입니까?

호스트를 강제가 아닌 정상적으로, 종료하면 다시 켜질 때까지 쿼럼 계산에서 임시로 제거됩니다. 그러나 호스트를 강제로 종료하거나 전원이 꺼진 경우에도 해당 호스트는 여전히 쿼럼 계산에 포함됩니다. 예를 들어, 3개의 호스트로 구성된 풀이 있고 그 중 2개를 강제로 종료한 경우 나머지 호스트는 더 이상 쿼럼이 없기 때문에 펜스합니다.

클러스터된 풀의 호스트는 항상 완전히 종료하십시오. 자세한 내용은 클러스터된 풀 관리.

클러스터된 풀 내의 모든 호스트가 동시에 다시 시작된 이유는 무엇입니까?

활성 클러스터의 모든 호스트는 풀의 연결 가능한 호스트 수가 다음 값보다 작을 경우 쿼럼이 손실된 것으로 간주됩니다.

  • 호스트 수가 짝수인 풀의 경우: n/2
  • 호스트 수가 홀수인 풀의 경우: (n+1)/2

문자 n은 클러스터된 풀에 있는 총 호스트 수를 나타냅니다. 쿼럼에 대한 자세한 내용은 다음을 참조하십시오. 쿼럼.

이 경우 모든 호스트가 자체 차단되고 모든 호스트가 다시 시작되는 것을 볼 수 있습니다.

풀에서 쿼럼이 손실된 이유를 진단하려면 다음 정보가 유용할 수 있습니다.

  • XenCenter에서 알림을 문제 발생 시간에 대한 섹션으로, 자체 펜싱이 발생했는지 여부를 확인합니다.
  • 클러스터 호스트에서 /var/opt/xapi-clusterd/부팅 시간 예기치 않은 시간에 재부팅이 발생했는지 확인합니다.
  • 안으로 Crit.log에서 자체 보호(fencing) 메시지가 출력되는지 확인합니다.
  • 를 검토합니다. dlm_tool 상태 펜싱 정보에 대한 명령 출력입니다.

    본보기 dlm_tool 상태 출력:

       dlm_tool status
    
       cluster nodeid 1 quorate 1 ring seq 8 8
       daemon now 4281 fence_pid 0
       node 1 M add 3063 rem 0 fail 0 fence 0 at 0 0
       node 2 M add 3066 rem 0 fail 0 fence 0 at 0 0
     <!--NeedCopy-->
    

디버깅을 위해 로그를 수집할 때 클러스터의 모든 호스트에서 진단 정보를 수집합니다. 단일 호스트가 자체 펜싱된 경우 클러스터의 다른 호스트에 유용한 정보가 있을 가능성이 더 높습니다.

클러스터된 풀의 호스트에 대한 전체 서버 상태 보고서를 수집합니다. 자세한 내용은 Citrix Hypervisor 서버 상태 보고서.

쿼럼이 있을 때 클러스터된 풀을 복구할 수 없는 이유는 무엇인가요?

호스트 수가 짝수인 클러스터된 풀이 있는 경우 필요한 호스트 수 이루다 쿼럼은 필요한 호스트 수보다 하나 더 많습니다. 유지 쿼럼. 쿼럼에 대한 자세한 내용은 다음을 참조하십시오. 쿼럼.

짝수 번호 풀에 있고 호스트의 절반을 복구한 경우 클러스터를 복구하기 전에 호스트를 하나 더 복구해야 합니다.

왜 나는 볼 수 있을까 유효하지 않은 토큰 클러스터 설정을 변경할 때 오류가 발생했습니까?

클러스터의 구성을 업데이트할 때 잘못된 토큰에 대한 다음과 같은 오류 메시지가 표시될 수 있습니다 ("[[\"InternalError\",\"유효하지 않은 토큰\"]]").

다음 단계를 완료하여 이 문제를 해결할 수 있습니다.

  1. (선택 사항) xapi-clusterd 및 시스템 로그가 포함된 서버 상태 보고서를 수집하여 현재 클러스터 구성을 백업합니다.

  2. XenCenter를 사용하여 클러스터된 풀에서 GFS2 SR을 분리합니다.

    수영장에서 보관 탭에서 GFS2 SR을 마우스 오른쪽 버튼으로 클릭하고 떼다….

  3. 클러스터의 모든 호스트에서 다음 명령을 실행하여 클러스터를 강제로 삭제합니다.

      xe cluster-pool-force-destroy cluster-uuid=<uuid>
    
  4. XenCenter를 사용하여 풀에서 클러스터링을 다시 사용하도록 설정합니다.

    1. 도구 모음에서 풀 > 속성.
    2. 안에 클러스터링 탭에서 클러스터링 사용 을 클릭하고 클러스터링에 사용할 네트워크를 선택합니다.
    3. 클릭 그래 변경 사항을 적용하려면
  5. XenCenter를 사용하여 GFS2 SR을 풀에 다시 연결합니다

    수영장에서 보관 탭에서 GFS2 SR을 마우스 오른쪽 버튼으로 클릭하고 수리.

클러스터된 풀 문제 해결Troubleshoot clustered pools