Andere Szenarien führen jedoch dazu, dass die GPUs in einen Notstromreduzierungszustand (Power Brake)
übergehen, was sich auf die Leistung auswirkt:
• Stromverlust.
• Eine Meldung zum Netzteil mit Drossel (wird typischerweise verwendet, wenn ein Netzteil zu heiß ist).
• Eingangstemperatur überschreitet die unterstützte ASHRAE-Spezifikation (z. B. 35 °C für ASHRAE A2).
• Eingangstemperatur überschreitet 27 °C in Kombination mit einem Lüfterausfall.
Um zu überwachen, ob eines dieser Szenarien aufgetreten ist, überprüfen Sie die Systemfehler-LED und das
Ereignisprotokoll des XClarity Controller auf Fehler im Zusammenhang mit Redundanz, einem
verschlechterten Zustand oder einer Drosselung der PCIe-Stromversorgung.
Führen Sie zur Lösung des Problems die folgenden Schritte aus:
1. Stellen Sie sicher, dass zwei 2.000-W-Netzteile installiert, betriebsbereit und eingeschaltet sind (ohne
Fehler).
2. Prüfen Sie das Ereignisprotokoll des XClarity Controller auf alle Ereignisse im Zusammenhang mit
Lüfterausfällen. Wenn Fehler auftreten, ersetzen Sie den fehlerhaften Lüfter.
3. Überprüfen Sie die Umgebungstemperatur des Rechenzentrums, in dem der Server installiert ist.
4. Überprüfen Sie den Drosselungsmodus der PCIe-Stromversorgung.
Konfigurationsprobleme mit dem PCIe-Kabel oder Erweiterungsgehäuse
Mit diesen Informationen können Sie Probleme im Zusammenhang mit der PCIe-Verkabelung beheben.
Bei einem lose oder falsch angeschlossenen PCIe-Kabelanschluss leuchtet die Fehleranzeige, und das
folgende Ereignis wird im XClarity Controller-Ereignisprotokoll protokolliert:
The connector %s has encountered a configuration error.
dabei ist %s eine der folgenden Zeichenfolgen:
• E/A-Riser
• PCIe-Erweiterung 1
• PCIe-Erweiterung 2
• PCIe-Verbindung N, wobei N eine Zahl zwischen 1 bis 12 ist, die den PCIe-Steckplatz auf der
Systemplatine darstellt.
Führen Sie zur Lösung des Problems die folgenden Schritte aus:
• Um Fehler mit dem E/A-Erweiterungsgehäuse zu beheben, vergewissern Sie sich, dass die Brücke 11
(J11) auf der E/A-Erweiterungsgehäusekarte auf Standard eingestellt ist.
• Um Fehler mit dem PCIe-Erweiterungsgehäuse 1 oder dem PCIe-Erweiterungsgehäuse 2 zu beheben,
vergewissern Sie sich, dass die Brücke 11 (J11) auf der PCIe-Erweiterungsgehäusekarte auf Invertiert
eingestellt ist.
• Führen Sie die folgenden Schritte aus, um Fehler mit PCIe-Verbindung N zu beheben:
1. Stellen Sie sicher, dass alle PCIe-Kabel mit den richtigen Positionen verbunden sind. Weitere
Informationen zur Kabelführung finden Sie im Abschnitt:
–
„Kabelführung für das E/A-Erweiterungsgehäuse" auf Seite 33
–
„Kabelführung für das PCIe-Erweiterungsgehäuse 1 mit 3 Steckplätzen" auf Seite 37
–
„Kabelführung für das PCIe-Erweiterungsgehäuse 2 mit 3 Steckplätzen" auf Seite 46
208
ThinkSystem SR670 Wartungshandbuch