Problembehandlung bei Clusterpools
Wichtig:
Citrix Hypervisor 8.2 Kumulatives Update 1 wird am 25. Juni 2025 End of Life. Planen Sie jetzt Ihr Upgrade auf XenServer 8, um einen reibungslosen Übergang und kontinuierlichen Support zu gewährleisten. Weitere Informationen finden Sie unter Upgrade.
Wenn Sie Ihre Citrix Virtual Apps and Desktops-Lizenzdateien verwenden, um Ihre Citrix Hypervisor 8.2 Cumulative Update 1-Hosts zu lizenzieren, sind diese Lizenzdateien nicht mit XenServer 8 kompatibel. Vor dem Upgrade müssen Sie XenServer Premium Edition-Socket-Lizenzdateien für die Verwendung mit XenServer 8 erwerben. Diese Socket-Lizenzdateien sind als Berechtigung für die Abonnements Citrix für Private Cloud, Citrix Universal Hybrid Multi-Cloud, Citrix Universal MSP und Citrix Platform License für die Ausführung Ihrer Citrix-Workloads verfügbar. Citrix-Kunden, die noch nicht auf diese neuen Abonnements umgestiegen sind, können die Teilnahme an einer kostenlosen Aktion für 10.000 XenServer Premium Edition-Socket-Lizenzen anfordern. Weitere Informationen finden Sie unter XenServer (Englisch).
Wenn Sie vor dem Upgrade keine kompatible Lizenz für XenServer 8 erhalten, werden Ihre Hosts beim Upgrade auf die 90-Tage-Testversion zurückgesetzt. Die Testversion bietet die gleichen Funktionen wie die Premium Edition, jedoch mit einigen Einschränkungen. Weitere Informationen finden Sie unter Übersicht über die XenServer 8-Lizenzierung.
Citrix Hypervisor-Pools, die GFS2 verwenden, um ihren gemeinsam genutzten Blockspeicher schlank bereitzustellen, sind geclustert. Diese Pools verhalten sich anders als Pools, die gemeinsam genutzten dateibasierten Speicher oder LVM mit gemeinsam genutztem Blockspeicher verwenden. Infolgedessen gibt es einige spezifische Probleme, die in Citrix Hypervisor-Clusterpools und GFS2-Umgebungen auftreten können.
Verwenden Sie die folgenden Informationen, um kleinere Probleme zu beheben, die bei der Verwendung dieser Funktion auftreten können.
Alle meine Hosts können sich gegenseitig anpingen, aber ich kann keinen Cluster erstellen. Warum?
Der Clustering-Mechanismus verwendet bestimmte Ports. Wenn Ihre Hosts über diese Ports nicht kommunizieren können (auch wenn sie über andere Ports kommunizieren können), können Sie das Clustering für den Pool nicht aktivieren.
Stellen Sie sicher, dass die Hosts im Pool über die folgenden Ports kommunizieren können:
- Telefon: 8892, 8896, 21064
- UDP: 5404, 5405 (nicht Multicast)
Wenn zwischen den Hosts im Pool Firewalls oder Ähnliches vorhanden sind, stellen Sie sicher, dass diese Ports geöffnet sind.
Wenn Sie zuvor HA im Pool konfiguriert haben, deaktivieren Sie die HA, bevor Sie das Clustering aktivieren.
Warum erhalte ich eine Fehlermeldung, wenn ich versuche, einen neuen Host mit einem vorhandenen Clusterpool zu verbinden?
Wenn die Clusterbildung in einem Pool aktiviert ist, muss jede Änderung der Poolmitgliedschaft von jedem Mitglied des Clusters genehmigt werden, bevor sie erfolgreich sein kann. Wenn ein Clustermitglied nicht kontaktiert werden kann, schlagen Vorgänge fehl, die die Clustermitgliedschaft ändern (z. B. Host hinzufügen oder Host entfernen).
So fügen Sie den neuen Host zum Clusterpool hinzu:
-
Stellen Sie sicher, dass alle Ihre Gastgeber online sind und kontaktiert werden können.
-
Stellen Sie sicher, dass die Hosts im Pool über die folgenden Ports kommunizieren können:
- Telefon: 8892, 8896, 21064
- UDP: 5404, 5405 (nicht Multicast)
-
Stellen Sie sicher, dass dem beitretenden Host eine IP-Adresse auf der Netzwerkkarte zugewiesen ist, die dem Clusternetzwerk des Pools beitritt.
-
Stellen Sie sicher, dass kein Host im Pool offline ist, wenn ein neuer Host versucht, dem Clusterpool beizutreten.
-
Wenn ein Offlinehost nicht wiederhergestellt werden kann, markieren Sie ihn als inaktiv, um ihn aus dem Cluster zu entfernen. Weitere Informationen finden Sie unter Ein Host in meinem Clusterpool ist offline und kann nicht wiederhergestellt werden. Wie entferne ich den Host aus meinem Cluster?
Was kann ich tun, wenn einige Mitglieder des Clusterpools dem Cluster nicht automatisch beitreten?
Dieses Problem kann dadurch verursacht werden, dass Mitglieder des Clusterpools die Synchronisierung verlieren.
Verwenden Sie den folgenden Befehl, um die Mitglieder des Clusterpools erneut zu synchronisieren:
xe cluster-pool-resync cluster-uuid=<cluster_uuid>
Wenn das Problem weiterhin besteht, können Sie versuchen, den GFS2 SR wieder anzuschließen. Sie können diese Aufgabe mithilfe der xe CLI oder über XenCenter ausführen.
Fügen Sie die GFS2 SR mithilfe der xe CLI erneut an:
-
Trennen Sie den GFS2 SR vom Pool. Führen Sie auf jedem Host den Befehl xe CLI aus
xe pbd-unplug uuid=<uuid_of_pbd>
. -
Deaktivieren Sie den Clusterpool mit dem Befehl
xe cluster-pool-destroy cluster-uuid=<cluster_uuid>
Wenn der vorherige Befehl nicht erfolgreich ist, können Sie die Deaktivierung eines Clusterpools erzwingen, indem Sie
xe cluster-host-force-destroy uuid=<cluster_host>
auf jedem Host im Pool. -
Aktivieren Sie den Clusterpool erneut, indem Sie den Befehl
xe cluster-pool-create network-uuid={\[--lt--]}network_uuid> [cluster-stack=cluster_stack\] \[token-timeout=token_timeout\] [token-timeout-koeffizient=token_timeout_coefficient]
-
Fügen Sie den GFS2 SR wieder an, indem Sie den Befehl
xe pbd-stecker uuid=<uuid_of_pbd>
auf jedem Host.
Alternativ können Sie XenCenter verwenden, um den GFS2 SR wieder anzuhängen:
- Im Pool Lagerung , klicken Sie mit der rechten Maustaste auf die GFS2 SR und wählen Sie Abtrennen….
- Wählen Sie in der Symbolleiste Tümpel > Eigenschaften.
- Im Clusterbildung Tab, deaktivieren Sie die Option Aktivieren von Clustering.
- Klicken OKAY , um Ihre Änderung zu übernehmen.
- Wählen Sie in der Symbolleiste Tümpel > Eigenschaften.
- Im Clusterbildung Registerkarte, wählen Sie Aktivieren von Clustering und wählen Sie das Netzwerk aus, das für das Clustering verwendet werden soll.
- Klicken OKAY , um Ihre Änderung zu übernehmen.
- Im Pool Lagerung , klicken Sie mit der rechten Maustaste auf die GFS2 SR und wählen Sie Reparieren.
Woher weiß ich, ob mein Gastgeber sich selbst eingezäunt hat?
Wenn Ihr Host sich selbst abgeschirmt hat, ist er dem Cluster beim Neustart möglicherweise wieder beigetreten. Um festzustellen, ob ein Host sich selbst abgeschirmt und wiederhergestellt hat, können Sie die Option /var/opt/xapi-clusterd/boot-zeiten
, um die Startzeiten des Hosts anzuzeigen. Wenn die Datei Startzeiten enthält, die Sie nicht erwartet haben, hat sich der Host selbst abgeschirmt.
Warum ist mein Host offline? Wie kann ich es wiederherstellen?
Es gibt viele mögliche Gründe für einen Host, offline zu gehen. Je nach Grund kann der Host wiederhergestellt werden oder nicht.
Die folgenden Gründe dafür, dass ein Host offline ist, treten häufiger auf und können durch Wiederherstellen des Hosts behoben werden:
- Sauberes Herunterfahren
- Erzwungenes Herunterfahren
- Vorübergehender Stromausfall
- Neustart
Die folgenden Gründe dafür, dass ein Host offline ist, sind seltener:
- Dauerhafter Ausfall der Host-Hardware
- Dauerhafter Ausfall der Stromversorgung des Hosts
- Netzwerk-Partition
- Ausfall des Netzwerk-Switches
Diese Probleme können behoben werden, indem Hardware ausgetauscht oder ausgefallene Hosts als inaktiv markiert werden.
Ein Host in meinem Clusterpool ist offline und kann nicht wiederhergestellt werden. Wie entferne ich den Host aus meinem Cluster?
Sie können den Cluster anweisen, den Host zu vergessen. Durch diese Aktion wird der Host dauerhaft aus dem Cluster entfernt und die Anzahl der für das Quorum erforderlichen Live-Hosts verringert.
Verwenden Sie den folgenden Befehl, um einen nicht wiederherstellbaren Host zu entfernen:
xe host-forget uuid=<host_uuid>
Mit diesem Befehl wird der Host dauerhaft aus dem Cluster entfernt und die Anzahl der für das Quorum erforderlichen Live-Hosts verringert.
Hinweis:
Wenn der Host nicht offline ist, kann dieser Befehl zu Datenverlust führen. Sie werden aufgefordert, zu bestätigen, dass Sie sicher sind, bevor Sie mit dem Befehl fortfahren.
Nachdem ein Host als tot markiert wurde, kann er dem Cluster nicht mehr hinzugefügt werden. Um diesen Host wieder zum Cluster hinzuzufügen, müssen Sie eine Neuinstallation von Citrix Hypervisor auf dem Host durchführen.
Ich habe einen Host repariert, der als tot markiert war. Wie füge ich es wieder zu meinem Cluster hinzu?
Ein Citrix Hypervisor-Host, der als tot markiert wurde, kann dem Cluster nicht wieder hinzugefügt werden. Um dieses System wieder zum Cluster hinzuzufügen, müssen Sie eine Neuinstallation von XenServer durchführen. Diese Neuinstallation wird dem Cluster als neuer Host angezeigt.
Was kann ich tun, wenn mein Cluster immer wieder das Quorum verliert und seine Hosts weiterhin fencingen?
Wenn einer oder mehrere der Citrix Hypervisor-Hosts im Cluster aufgrund des kontinuierlichen Verlierens und Erreichens des Quorums in eine Fence-Schleife geraten, können Sie den Host mit dem nocluster
Kernel-Befehlszeilenargument. Stellen Sie eine Verbindung zur physischen oder seriellen Konsole des Hosts her, und bearbeiten Sie die Boot-Argumente in grub.
Beispiel
/boot/grub/grub.cfg
menuentry 'XenServer' {
search --label --set root root-oyftuj
multiboot2 /boot/xen.gz dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G console=vga vga=mode-0x0311
module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable xencons=hvc console=hvc0 console=tty0 quiet vga=785 splash plymouth.ignore-serial-consoles nocluster
module2 /boot/initrd-4.4-xen.img
}
menuentry 'Citrix Hypervisor (Serial)' {
search --label --set root root-oyftuj
multiboot2 /boot/xen.gz com1=115200,8n1 console=com1,vga dom0_mem=4096M,max:4096M watchdog ucode=scan dom0_max_vcpus=1-16 crashkernel=192M,below=4G
module2 /boot/vmlinuz-4.4-xen root=LABEL=root-oyftuj ro nolvm hpet=disable console=tty0 xencons=hvc console=hvc0 nocluster
module2 /boot/initrd-4.4-xen.img
}
<!--NeedCopy-->
Was geschieht, wenn der Poolmaster in einem Clusterpool neu gestartet wird?
In den meisten Fällen ist das Verhalten beim Herunterfahren oder Neustart des Poolmasters in einem Clusterpool identisch mit dem Verhalten beim Herunterfahren oder Neustart eines anderen Poolmitglieds.
Die Art und Weise, wie der Host heruntergefahren oder neu gestartet wird, kann sich auf das Quorum des Clusterpools auswirken. Weitere Informationen zum Quorum finden Sie unter Quorum.
Der einzige Unterschied im Verhalten hängt davon ab, ob HA in Ihrem Pool aktiviert ist:
- Wenn HA aktiviert ist, wird ein neuer Master ausgewählt und der allgemeine Dienst beibehalten.
- Wenn HA nicht aktiviert ist, gibt es keinen Master für den Pool. Ausgeführte VMs auf den verbleibenden Hosts werden weiterhin ausgeführt. Die meisten Verwaltungsvorgänge sind erst verfügbar, wenn der Master neu gestartet wird.
Warum ist mein Pool verschwunden, nachdem ein Host im Clusterpool zum Herunterfahren gezwungen wurde?
Wenn Sie einen Host normal (nicht erzwungen) herunterfahren, wird er vorübergehend aus den Quorumberechnungen entfernt, bis er wieder aktiviert wird. Wenn Sie jedoch das erzwungene Herunterfahren eines Hosts erzwingen oder die Stromversorgung unterbrochen wird, wird dieser Host weiterhin für die Quorumberechnungen berücksichtigt. Wenn Sie z. B. einen Pool von 3 Hosts hatten und 2 von ihnen zwangsweise heruntergefahren haben, wird der verbleibende Host abgegrenzt, da er nicht mehr über ein Quorum verfügt.
Versuchen Sie, Hosts in einem Clusterpool immer sauber herunterzufahren. Weitere Informationen finden Sie unter Verwalten des Clusterpools.
Warum wurden alle Hosts innerhalb des Clusterpools gleichzeitig neu gestartet?
Bei allen Hosts in einem aktiven Cluster wird davon ausgegangen, dass das Quorum verloren wurde, wenn die Anzahl der kontaktierbaren Hosts im Pool kleiner als die folgenden Werte ist:
- Für einen Pool mit einer geraden Anzahl von Hosts: n/2
- Für einen Pool mit einer ungeraden Anzahl von Hosts: (n+1)/2
Der Buchstabe n gibt die Gesamtzahl der Hosts im Clusterpool an. Weitere Informationen zum Quorum finden Sie unter Quorum.
In dieser Situation führen alle Hosts ein Self-Fence durch, und Sie sehen, dass alle Hosts neu gestartet werden.
Um zu diagnostizieren, warum der Pool das Quorum verloren hat, können die folgenden Informationen nützlich sein:
- Aktivieren Sie in XenCenter die Option Benachrichtigungen für den Zeitpunkt des Problems, um zu sehen, ob eine Selbstabgrenzung aufgetreten ist.
- Aktivieren Sie auf den Clusterhosts
/var/opt/xapi-clusterd/boot-zeiten
, um zu sehen, ob ein Neustart zu einem unerwarteten Zeitpunkt stattgefunden hat. - In
Crit.log
, prüfen Sie, ob Self-Fencing-Nachrichten ausgegeben werden. -
Überprüfen Sie die
dlm_tool Status
Befehlsausgabe für Fencing-Informationen.Beispiel
dlm_tool Status
Ausgabe:dlm_tool status cluster nodeid 1 quorate 1 ring seq 8 8 daemon now 4281 fence_pid 0 node 1 M add 3063 rem 0 fail 0 fence 0 at 0 0 node 2 M add 3066 rem 0 fail 0 fence 0 at 0 0 <!--NeedCopy-->
Sammeln Sie beim Sammeln von Protokollen für das Debuggen Diagnoseinformationen von allen Hosts im Cluster. In dem Fall, dass ein einzelner Host sich selbst abgeschirmt hat, ist es wahrscheinlicher, dass die anderen Hosts im Cluster über nützliche Informationen verfügen.
Erfassen Sie vollständige Serverstatusberichte für die Hosts in Ihrem Clusterpool. Weitere Informationen finden Sie unter Statusberichte für Citrix Hypervisor-Server.
Warum kann ich meinen Clusterpool nicht wiederherstellen, wenn ich über ein Quorum verfüge?
Wenn Sie über einen Clusterpool mit einer geraden Anzahl von Hosts verfügen, wird die Anzahl der Hosts, die für erreichen Das Quorum ist einer mehr als die Anzahl der Hosts, die erforderlich sind, um behalten Quorum. Weitere Informationen zum Quorum finden Sie unter Quorum.
Wenn Sie sich in einem Pool mit geraden Zahlen befinden und die Hälfte der Hosts wiederhergestellt haben, müssen Sie einen weiteren Host wiederherstellen, bevor Sie den Cluster wiederherstellen können.
Ungültiges Token
Fehler beim Ändern der Cluster-Einstellungen?
Warum sehe ich eine Beim Aktualisieren der Konfiguration Ihres Clusters wird möglicherweise die folgende Fehlermeldung über ein ungültiges Token angezeigt ("[[\"InternalError\",\"Ungültiges Token\"]]")
.
Sie können dieses Problem beheben, indem Sie die folgenden Schritte ausführen:
-
(Fakultativ) Sichern Sie die aktuelle Clusterkonfiguration, indem Sie einen Serverstatusbericht erfassen, der die xapi-clusterd- und Systemprotokolle enthält.
-
Verwenden Sie XenCenter, um den GFS2 SR vom Clusterpool zu trennen.
Im Pool Lagerung , klicken Sie mit der rechten Maustaste auf die GFS2 SR und wählen Sie Abtrennen….
-
Führen Sie auf einem beliebigen Host im Cluster den folgenden Befehl aus, um die Zerstörung des Clusters zu erzwingen:
xe cluster-pool-force-destroy cluster-uuid=<uuid>
-
Verwenden Sie XenCenter, um das Clustering in Ihrem Pool wieder zu aktivieren.
- Wählen Sie in der Symbolleiste Tümpel > Eigenschaften.
- Im Clusterbildung Registerkarte, wählen Sie Aktivieren von Clustering und wählen Sie das Netzwerk aus, das für das Clustering verwendet werden soll.
- Klicken OKAY So wenden Sie Ihre Änderung an
-
Verwenden Sie XenCenter, um den GFS2 SR wieder an den Pool anzuhängen
Im Pool Lagerung , klicken Sie mit der rechten Maustaste auf die GFS2 SR und wählen Sie Reparieren.
In diesem Artikel
- Alle meine Hosts können sich gegenseitig anpingen, aber ich kann keinen Cluster erstellen. Warum?
- Warum erhalte ich eine Fehlermeldung, wenn ich versuche, einen neuen Host mit einem vorhandenen Clusterpool zu verbinden?
- Was kann ich tun, wenn einige Mitglieder des Clusterpools dem Cluster nicht automatisch beitreten?
- Woher weiß ich, ob mein Gastgeber sich selbst eingezäunt hat?
- Warum ist mein Host offline? Wie kann ich es wiederherstellen?
- Ein Host in meinem Clusterpool ist offline und kann nicht wiederhergestellt werden. Wie entferne ich den Host aus meinem Cluster?
- Ich habe einen Host repariert, der als tot markiert war. Wie füge ich es wieder zu meinem Cluster hinzu?
- Was kann ich tun, wenn mein Cluster immer wieder das Quorum verliert und seine Hosts weiterhin fencingen?
- Was geschieht, wenn der Poolmaster in einem Clusterpool neu gestartet wird?
- Warum ist mein Pool verschwunden, nachdem ein Host im Clusterpool zum Herunterfahren gezwungen wurde?
- Warum wurden alle Hosts innerhalb des Clusterpools gleichzeitig neu gestartet?
- Warum kann ich meinen Clusterpool nicht wiederherstellen, wenn ich über ein Quorum verfüge?
- Warum sehe ich eine Ungültiges Token Fehler beim Ändern der Cluster-Einstellungen?