Home

Rechenknoten

Rechenknoten sind zentrale Bausteine von Rechenclustern, in denen Benutzeraufgaben parallel ausgeführt werden. Jeder Rechenknoten ist eigenständig, verfügt über Prozessor(en), Arbeitsspeicher, lokale Speicherressourcen und eine Netzwerkschnittstelle und ist über eine Hochgeschwindigkeitsverbindung mit dem Rest des Clusters verbunden. Im Gegensatz zum Head- oder Login-Knoten führen Rechenknoten die eigentlichen Rechenaufgaben aus, oft in Form von MPI- oder OpenMP-Jobs, und kommunizieren über das Netzwerk.

Typische Hardware umfasst Mehrkern- oder Mehrprozessor-CPUs, großen RAM, ggf. lokalen SSD- oder HDD-Speicher für Zwischenspeicher, sowie

Der Betrieb erfolgt über eine Job-Scheduling- oder Resource-Management-Software (z. B. Slurm, PBS, Grid Engine). Benutzer reichen

Wichtige Aspekte sind Skalierbarkeit, Energieeffizienz und Zuverlässigkeit. ECC-Speicher, redundante Netzteile, Monitoring und regelmäßige Wartung erhöhen die

ECC-RAM
zur
Fehlerkorrektur.
Die
Rechenknoten
werden
über
Hochgeschwindigkeitsverbindungen
wie
InfiniBand,
Omni-Path
oder
10/25/100
Gigabit-Ethernet
miteinander
vernetzt,
oft
in
Rack-Schaltschränken
mit
redundanten
Netzteilen
und
Kühlung.
Viele
Cluster
verwenden
gemeinsam
genutzte
Parallel-Dateisysteme
(z.
B.
Lustre,
BeeGFS);
Rechenknoten
besitzen
meist
keinen
großen
lokalen
Speicher.
Jobs
über
Warteschlangen
ein;
der
Scheduler
weist
Rechenknoten
zu,
startet
Prozesse
(oft
MPI),
und
sammelt
Ergebnisse.
Head-Knoten
oder
Steuerknoten
verwalten
das
Cluster,
starten
Jobs,
liefern
Zugriff
auf
Dateisysteme
und
überwachen
Ressourcen.
Stabilität.
Rechenknoten
bilden
zusammen
mit
Storage-
und
Login-Knoten
die
Infrastruktur
moderner
HPC-Umgebungen
und
werden
auch
in
Cloud-
oder
hybriden
Umgebungen
bereitgestellt.