Die NVIDIA RTX 4090 ist eine unglaublich leistungsstarke GPU. Als Consumer Grafikkarte für den Gamer Markt entwickelt, bringt sie bei Visualisierungs- und Renderjobs sowie bei KI-Anwendungen ebenfalls eine Topleistung; dies notabene zu einem vergleichsweise sehr attraktiven Preis.
Zur Erinnerung: die NVIDIA RTX 4090 bietet neben 16384 CUDA-Recheneinheiten weiter 128 Raytracing Cores sowie für KI-Kalkulationen 512 Tensor Cores. Damit ist sie für viele professionelle Workflows bestens geeignet. Gerade Render- und Deep Learning Anwendungen skalieren maximal mit der Anzahl an GPU’s.
Die RTX 4090 Grafikkarten sind physisch sehr gross und äusserst leistungshungrig. Sie besetzen bis zu 4 Slots und haben eine maximale Leistungsaufnahme von 450 Watt. Die schiere Grösse der Grafikkarte ist der Luftkühlung mit bis zu fünf Fans geschuldet, die eigentliche Backplane einer RTX 4090 benötigt nur einen Slot und entspricht der Standartgrösse. Das folgende Bild zeigt die Dimensionen der Backplane mit den Recheneinheiten und die Kühler, die zur Kühlung dieser hohen Leistung notwendig sind, separat.
Konfiguration einer Workstation mit maximaler CPU / GPU Rechenleistung
Welche Leistung hat erst eine Workstation, welche bis vier RTX 4090 aufnehmen kann? In den vorangehenden GPU Versionen von Nvidia war dies mit den Blowerversionen im 2 Slot Design möglich. Es tauchen zwar immer wieder RTX 4090 Blowerstyle Modelle von bekannten Herstellern bei chinesischen Händlern auf. Ich werde aber den Eindruck nicht los, dass diese in Handarbeit nachträglich zum Blowermodell umgebaut wurden.
Wir haben uns entschieden eine professionelle Workstation mit vier RTX 4090 in einem Workstation Gehäuse zu bauen, was zur Zeit nur mit "Liquid-Cooling" möglich ist.
Folgende Anforderungen haben wir an das System gestellt:
- Volle Leistung der GPUs und von CPU
- Voller PCIe Durchsatz zu allen GPUs im PCIe x16 Gen 4 Mode
- Alltagstauglich und stabil
- Minimaler Wartungsaufwand
Entsprechend haben wir die Konfiguration wie folgt zusammengestellt:
- AMD Threadripper PRO 5995WX mit 64 Cores
- 512 GB ECC Arbeitsspeicher
- 4 x Nvidia RTX 4090 Grafikkarte
- Mehrere schnelle M.2 SSDs
Die Leistung dieser Konfiguration ist weit überdurchschnittlich. Die damit verbundene Leistungsaufnahme von fast 2000 Watt und die Kühlung dieser enormen Energieaufnahme sind eine echte Herausforderung. Für eine genügende Stromversorgung werden zwei High Performance Netzteile eingesetzt.
Für die Kühlung von CPU und GPUs setzen wir auf eine Custom Made Liquid Cooling Lösung. Die CPU sowie die GPUs werden mit einer integrierten Wasserkühlung gekühlt. Die Kühlflüssigkeit wird durch drei grosse Radiatoren geführt. Eine Nvidia RTX 4090 Grafikkarte mit Wasserkühlung nimmt noch einen Slot Platz ein, so dass diese High Performance Konfiguration in einem Gehäuse Platz findet.
Herausfordernde Herstellung
Der Bau dieses wassergekühlten Systems ist nicht trivial. Für unseren Chef-Techniker Thimo war das eine spannende Aufgabe, wobei die grösste Herausforderung in der Konzeption des Systems bestand. Das Zusammenstellen der genau passenden Komponenten und die Gestaltung des Loops der Wasserkühlung, so dass alle Komponenten gut und effizient gekühlt werden, hat viel Denkarbeit erfordert.
Bei der Herstellung ist anschliessend eine hoch präzise Arbeitsweise die Voraussetzung für ein funktionierendes System. Zuerst werden die Komponenten mit Luftkühlung getestet, anschliessend mit spezifischen Liquid-Cooling Elementen umgebaut und dann wird der Liquid-Cooling PC Schritt für Schritt zusammengebaut. Anspruchsvoll ist insbesondere auch das Kabelmanagement der vielen Lüfter, die für 3 grosse Radiatoren gebraucht werden.
Spannend wird es schliesslich wenn das System mit Wasser befüllt wird und sich im Leak-Test zeigt ob alles dicht ist. Als wir das System in Betrieb genommen haben, haben uns vor allem die Temperaturen überrascht. Unter Volllast sind alle Grafikkarten unter 70 Grad geblieben, beim Prozessor war der höchste gemessene Wert nur 72 Grad.
Fazit
Ein High Performance System mit 65'536 Cuda Cores der GPUs sowie 64 Cores des Prozessors wird mit einer professionellen Liquid-Cooling Lösung möglich gemacht, wobei auch unter Volllast ein Betrieb mit relativ wenig Geräuschbelastung und mit sehr moderaten Temperaturen möglich ist.
Ein derartiges Liquid Cooling System kann im brentford Online Shop flexibel individuell konfiguriert werden. Als Prozessor Plattform kann AMD Threadripper PRO oder Intel Xeon W gewählt werden. Beide Plattformen bieten genügend PCIe X16 Gen 4/5 Lanes um das volle Potential von 4 NVIDIA RTX 4090 Grafikkarten auszuschöpfen.
Wo liegen die Limitationen bei dieser Lösung? Die Nvidia RTX 4090 GPUs bieten kein NVLink und damit ist ein VRAM Pooling nicht möglich. Für die meisten Anwendungen ist dies kein Problem. Für professionelle Workloads, welche hohe VRAM Kapazität fordern, sind die Profi Grafikarten NVIDA RTX 6000 ADA die bessere Wahl.