Leistung für Rechenzentren

Nvidia hat mit der Nvidia Tesla P100 eine seine bislang leistungsstärkste Grafikarte für Server vorgestellt. In Rechenzentren soll die GPU zukünftig technisch-wissenschaftliche Anwendungen beflügeln.

28. Juni 2016

Die neue Tesla P100 ist ab jetzt die leistungsstärkste Grafikkarte von Nvidia für Server. Die P100 soll besonders durch ihre effiziente Pascal-Architektur, 3584 Kerne und 16 GByte gestapeltes HBM-2-RAM ("High Bandwidth Memory") zu großer Form auflaufen: Laut Nvidia erreicht eine Tesla P100 den Durchsatz von 32 CPU-basierten Rechenknoten. Auch die Server-GPU Tesla K 80 wird bei den meisten Anwendungen im Rechendurchsatz mehrfach überboten. Je nach verwendeter Rechengenauigkeit (halb, ganz, doppelt) und Serverarchitektur (PCIe oder NVLink) beträgt die Rechenleistung 4,7 Teraflops bis 21,2 Teraflops. 

"Beschleunigte Computer sind der einzige Weg, um mit dem unstillbaren Bedarf von Wissenschaftlern nach mehr Leistung für HPC und maschinelles Lernen Schritt zu halten", so Ian Buck, Vizepräsident für Accelerated Computing bei Nvidia. "Computer nur mit CPUs zu verwenden würde bedeuten, dass man sehr viele Rechenknoten braucht. Dadurch würden die Kosten wesentlich steigen, ohne dass die Rechenleistung proportional dazu steigt. Bei sehr gut skalierender Leistung mit weniger, aber stärkeren Rechenknoten in Form der Tesla P100 steckt man mehr Geld in die Rechenleistung statt in teure Infrastruktur. "

Zu den leistungssteigernden Faktoren der Chiparchitektur gehört die Packungsform "CoWoS" (Chip on Wafer on Substrate), sodass sich Prozessor und Speicher auf einem Chip befinden. Dies verdreifacht laut Nvidia gegenüber der vorher genutzten Maxwell-Architektur den Speicherdurchsatz auf 720 GByte/sec. Ein weiteres Merkmal ist die Programmiertechnik "Page Migration". Hierdurch können Entwickler die physische Größe des Speichers außer Acht lassen, weil bei Bedarf Daten vom Grafikspeicher in das RAM des Computers ausgelagert werden. Sofern die Software an die Pascal-Architektur angepasst wird, soll dies die Parallelisierung der Software vereinfachen.