IBM und das US Energieministerium wollen zwei der weltweit fortschrittlichsten „datenzentrischen“ Supercomputer an den US-Forschungsstandorten Lawrence Livermore und Oak Ridge aufbauen. Ein entsprechender Vertrag mit einem Wert von 325 Mio Dollar ist am Freitag letzter Woche unterzeichnet worden. Die Systeme sollen für Forschungen im Bereich Wissenschaft, Technik sowie der nationalen Sicherheit genutzt werden. Das IBM System nutzt eine neuartige, „datenzentrische“ Architektur, bei der die Systemtechnologien quasi um die Daten herum gebaut werden. Die Folge: Daten müssen seltener zwischen Speicher und Prozessoren hin und zurück transportiert werden, wodurch der Energieverbrauch des Gesamtsystems drastisch sinkt. Die Inbetriebnahme beider Rechner ist für 2017 beziehungsweise 2018 geplant.
Heute werden in Computern die Daten ständig zwischen Speicher und Prozessor hin und her geschickt, um sie zu bearbeiten oder zu analysieren. Im Umfeld von Big Data trägt dieser Ansatz nicht mehr, weil zu viel Zeit und Energie dafür aufgewendet werden muss. Um dem zu begegnen, wurden bisher immer schnellere Prozessoren eingesetzt, die allerdings aufgrund der Datenmengen immer weniger Kapazitäten zur Bearbeitung und Analyse zur Verfügung stellen konnten, da sie vielmehr mit dem Management und dem Transport der Daten zwischen den einzelnen Systemkomponenten beschäftigt waren.
IBM Forscher haben deshalb in den letzten fünf Jahren eine neuartige, datenzentrische Systemarchitektur entwickelt, in der die notwendigen Komponenten eines Computersystems und damit Rechenleistung dort „angesiedelt“ sind, wo die Daten sitzen. Damit können jetzt Datenanalyse, Modellierung, Visualisierung und Simulation mit bisher unerreichter Geschwindigkeit durchgeführt werden.
Zehn Mal mehr Leistung bei einem Fünftel der Energie
Die beiden Forschungszentren des Energieministeriums erwarten, dass die beiden IBM Supercomputer zu den energieeffizientesten Computersystemen weltweit gehören werden. Im Vergleich zu den bestehenden Systemen der Labore soll ihre Performance bis zu zehn Mal und ihre Energieeffizienz mehr als fünf Mal besser sein. Presseberichten zufolge sollen die beiden Systeme 300 beziehungsweise 500 % mehr leisten können als der weltweit zurzeit stärkste Supercomputer Tianhe mit einer Höchstleistung von 55 Petaflops. Die geplanten Superrechner sollen in der Spitze auf 100 bis 300 Petaflops kommen.
Die beiden auf OpenPOWER basierenden Installationen mit dem Namen „Sierra“ am Lawrence Livermore Institute und „Summit“ in Oak Ridge werden eine Leistung von jeweils mehr als 100 Petaflops erreichen und dabei fünf Petabyte an dynamischen und Flashspeichern nutzen. Der Datendurchsatz wird sich auf mehr als 17 Petabyte pro Sekunde summieren – dies entspricht etwa der Datenmenge von 100 Milliarden Bildern auf Facebook pro Sekunde.
Die Forschungsinstitute bieten Wissenschaftlern aus verschiedenen Fachgebieten sowie Behörden und Unternehmen die Möglichkeit, die Systeme zur Beantwortung unterschiedlichster wissenschaftlicher und technischer Fragestellungen zu nutzen. Durch den neuen Ansatz können die Installationen nicht mehr nur klassisch wissenschaftliche Daten modellieren und simulieren, sondern ihre Rechenleistung auch für hochkomplexe Datensätze beispielsweise aus dem Gesundheitswesen oder der Betriebs- und Finanzwirtschaft zur Verfügung stellen.
Abkehr vom traditionellen Supercomputing
Die wachsenden Notwendigkeiten, große Datenmengen und verschiedenartige Daten zu erfassen, zu managen und zu analysieren, macht es zunehmend erforderlich, die traditionelle Computerarchitektur durch offene Plattformen zu ergänzen oder zu ersetzen. Organisationen müssen die Herausforderungen, die diese Datenflut an sie stellen, ganzheitlich betrachten: angefangen vom Design eines Computersystems bis hin dazu, wie Daten genutzt werden sollen. Dies bedeutet, dass alle Schritte des Analyseprozesses von der Datengenerierung, über die Aufbereitung bis hin zur Auswertung betrachtet werden.
Die von NVIDIA in Zusammenarbeit mit IBM entwickelte NVLink-Technologie ermöglicht es CPUs und Grafikprozessoren, die Daten fünf bis 12-Mal schneller zwischen den entsprechenden Prozessoren zu bewegen. Die Technologie wird in den beiden Superrechnern für das Energiemninisterium verbaut und ihnen enorme Leistungen ermöglichen. Gemeinsam mit Mellanox wird IBM außerdem einen so genannten intelligenten Interconnect implementieren, um die Datenverarbeitung innerhalb der Systeme weiter zu optimieren.
„Die heutige Ankündigung markiert eine Abkehr vom traditionellen Supercomputing, das mit der wachsenden Datenflut nur noch unzureichend Schritt halten kann. Der datenzentrische Ansatz von IBM ist aus unserer Sicht das neue Paradigma in diesem Bereich: Offene Computerplattformen, die in der Lage sind, mit den wachsenden Datenmengen umzugehen,“ sagt Tom Rosamilia, Senior Vice President, IBM Systems and Technology Group. „Was die beiden Systeme zudem besonders macht: Die Kerntechnologien sind bereits heute für Unternehmen und Organisationen unterschiedlichster Größen und aus unterschiedlichsten Industriezweigen verfügbar.“
IBM Research wird zukünftig mit Lawrence Livermore und Oak Ridge zusammenarbeiten, um die bestmöglichen Tools und Technologien für die beiden Computersysteme zu entwickeln, um so die Leistung der Systeme zu optimieren. An der Entwicklung von Applikationen für datenzentrische Systeme werden auch Wissenschaftler des deutschen IBM Forschungs- und Entwicklungszentrum in Böblingen sowie von IBM Research – Zürich in Rüschlikon beteiligt sein.