MUSICA: Österreichs nächster Supercomputer
MUSICA: Österreichs nächster Supercomputer
MUSICA mit vernetzten HPC-Systemen in Innsbruck, Linz und Wien verspricht eine verbesserte Leistung für KI-Forschung und Anwendungen; am Standort Wien hat der Aufbau jetzt begonnen.
„Spitzenforschung ist heute mehr denn je auf entsprechende Infrastruktur und ausreichende Rechenleistung angewiesen. Das 'MUSICA-Projekt' ist ein Meilenstein für unsere heimische Forschungslandschaft und ein entscheidender Beitrag für Spitzenforschung insbesondere im KI- und Quantenbereich. Mit unserer Investition von insgesamt 36 Millionen Euro in den Supercomputer-Cluster MUSICA, schaffen wir die Grundlage zukunftsträchtige Innovationen und bahnbrechende Forschungserkenntnisse. Es freut mich außerordentlich, dass der Aufbau des nächsten Supercomputers am Standort Wien bereits begonnen hat“, so Martin Polaschek, Bundesminister für Bildung, Wissenschaft und Forschung.
Schon in der Vergangenheit waren Österreichs leistungsfähigste Supercomputer (die Vienna Scientific Clusters, VSCs) von mehreren Universitäten gemeinsam betrieben worden – bisher allerdings an einem zentralen Ort, mit online-Zugang für alle teilnehmenden Institutionen. Die Computerhardware selbst auf mehrere Standorte zu verteilen und damit High-Performance-Computing mit Cloud-Computing zu verbinden, ist eine Neuerung des MUSICA-Projekts.
Der Teil von MUSICA in Wien wird über 112 GPU- und 72 CPU-Knoten verfügen. Die Teile in Innsbruck und Linz jeweils über 80 GPU- und 48 CPU-Knoten. Die Hardware wird von Lenovo geliefert, der Speicher von MEGWARE. Am meisten werden von dieser Architektur die User_innen profitieren, die besonders datenintensive Berechnungen ausführen, speziell das Trainieren von Modellen der künstlichen Intelligenz das Anwenden von KI Modellen auf Forschungsfragen aus Naturwissenschaft und Technik sowie das Analysieren großer Datenmengen.
Mit MUSICA bekommen die User_innen deutlich mehr Rechenleistung: Die bisher schnellsten Supercomputer in Österreich, VSC-4 und VSC-5, erbringen gemeinsam eine Leistung von 5.01 Petaflops (Rechenoperationen pro Sekunde). Der neue HPC-Cluster wird eine Rechenleistung von etwa 40 Petaflops bereitstellen, was ihn unter die leistungsstärksten Systeme weltweit einreihen wird.
Die Aufteilung des Systems auf drei Standorte soll für die erhöhte Resilienz sorgen. Alle drei Standorte werden zwar zentral konfiguriert und verwaltet, können aber auch völlig autark betrieben werden. Für die User_innen wird MUSICA wie ein einzelnes HPC-System zugreifbar sein.
Kühlung und Energieeffizienz
Das System ist großteils direkt wassergekühlt – die Wärmeabfuhr erfolgt mittels wasserdurchflossenen Kühlelementen auf Prozessoren, GPUs und Arbeitsspeicher, womit der Energieaufwand für die Kühlung massiv gesenkt wird. Durch hohe Wassertemperaturen von etwa 40 °C kann fast das ganze Jahr über die Abwärme direkt an die Umgebungsluft abgeführt werden, ohne zusätzliche energieaufwendige Kühlgeräte. Die hohe Kühlwassertemperatur ermöglicht die Nachnutzung der Abwärme. In Wien erfolgt dies zur Beheizung benachbarter Gebäude.
Am Standort Innsbruck ist die Einspeisung der Abwärme ins Fernwärmenetz vorgesehen. In Linz befindet sich die Kühlinfrastruktur noch in Planung.
Der Betrieb von MUSICA erlaubt somit maximale Rechenpower für die Wissenschaft bei minimalem Energieverbrauch und setzt dadurch neue Maßstäbe in der Energieeffizienz am Stand der Technik.
Beschleunigt durch Quanten-Computing
Das MUSICA-Projekt wird im Rahmen des Aufbau- und Resilienzplans der Europäischen Union und der Forschungsinitiative Quantum Austria gefördert, mit der zusätzlichen Förderung vom BMBWF durch die FFG. Somit ist MUSICA auch zentraler Teil einer vollintegrierten, hybriden Infrastruktur für Quanten- und HPC-Computing.
Die Universität Innsbruck beschafft aktuell einen neuen Quanten-Computer, der künftig an MUSICA angebunden werden soll, um dadurch das System weiter beschleunigen zu können. Ein Proof of Concept mit den bestehenden lokalen Systemen ist bereits erfolgreich umgesetzt worden.
Aussicht
Die Installation von MUSICA in Wien ist derzeit im Gange. Im Spätherbst 2024 soll das System in den Testbetrieb gehen. Ab Januar 2025 soll der Regelbetrieb möglich sein.
Für Innsbruck und Linz erfolgt der Aufbau in der ersten Hälfte von 2025. Ab Juli 2025 soll auch dort der Regelbetrieb aufgenommen werden.
Partner
Am MUSICA-Projekt sind folgende österreichische Partner beteiligt:
Projektkoordinator: Technische Universität Wien
Projektpartner: Universität Wien, BOKU University, Universität Innsbruck, Technische Universität Graz, Johannes Kepler Universität Linz
Die wichtigsten Infos auf einen Blick
Gilt für alle Systeme (Wien, Linz und Innsbruck):
- GPU nodes: 4 x Nvidia H100 94 GB, connected via NVLINK, 2 x AMD Epyc 9654, 96 cores and 768 GB memory, 4 x NDR 200. Energiebedarf: max 4kW
- CPU nodes: 2 x AMD Epyc 9654, 96 cores and 768 GB memory, 1 x NDR 200
- WEKA Storage Server von MEGWARE: 12 NVMe Disk mit je 15, 36 TB, 2 x NDR400 Infiniband Hochgeschwindigkeitsnetzwerk.
- WEKA® Data Platform: 4 PB All-Flash Speicherlösung mit bis zu 1800 GB/s Lese- und 750 GB/s Schreibperformance.