Categories: KomponentenWorkspace

Nvidia macht neue Pascal-GPUs für neuronale Netze verfügbar

Nvidia hat neue Tesla-GPUs auf Basis der Architektur Pascal offiziell angekündigt. Die diesjährige Generation mit Tesla P4 und P40 ist nach seinen Angaben viermal schneller als der Vorgänger. Insbesondere der ab Oktober verfügbare Chip Tesla P40 eignet sich für neuronale Netze, die ähnlich wie das menschliche Gehirn aufgebaut sind. Der besonders sparsame P4 soll im November folgen.

Die Steigerung der Leistung um Faktor vier bezieht sich auf Nvidias letztjährige Tesla-Modelle M4 und M40. Im Vergleich zu einem Intel Xeon E5-2690v4 verspricht der Hersteller 45-mal höhere Reaktionszeit. Dies bezieht sich allerdings auf 8-Bit-Operationen (INT8). Die Leistungsaufnahme spezifiziert Nvidia mit 250 Watt.

Nvidias Datenblatt (PDF) zufolge bringt die GPU Tesla P40 12 Teraflops Leistung bei Gleitkommaberechnungen mit einfacher Genauigkeit und schafft 47 Billionen Int8-Operationen pro Sekunde. Dies ermöglichen integrierte 24 GByte DDR5-Speicher mit einer Bandbreite von 246 GBit/s und 3840 CUDA-Cores.

Nvidia P4 (PDF) kommt auf 5,5 Teraflops bei Fließkommaberechnungen und 22 Billionen Int-8-Operationen pro Sekunde. In ihr stecken 2560 CUDA-Cores und 8 GByte DDR5-Speicher mit nur 192 GBit/s Bandbreite. Die Leistungsaufnahme beginnt bei 50 Watt. Im Vergleich zum Intel Xeon E5-2690v4 verspricht Nvidia 40-mal bessere Energieeffizienz. Ein einzelner Server mit einer P4-GPU könne bei Videoberechnungen 13 Server nur mit CPU ersetzen, schreibt Nvidia. Die Cost of Ownership betrage nur ein Achtel, wenn man Anschaffung und Strom berücksichtige.

HIGHLIGHT

Mehr Sicherheit im smarten Zuhause

Wie Sie Ihr persönliches Internet der Dinge vor versteckten Gefahren schützen

Parallel hat Nvidia seine Library TensorRT auf Version 2 aktualisiert und ein Deepstream SDK verfügbar gemacht. TensorRT kann für 16 oder 32 Bit kompilierten Code für trainierte neuronale Netze für 8 Bit optimieren. Deepstream ist darauf ausgelegt, bis zu 93 HD-Video-Streams simultan in Echtzeit auszuwerten. Nvidia sagt über Deepstream, es löse „eines der großen Probleme Künstlicher Intelligenz: Video-Inhalte im großen Maßstab zu deuten, für Anwendungen wie vernetzte Autos, interaktive Roboter, Filter und Anzeigenplatzierung.“

Die Pascal-Architektur hatte Nvidia im Frühjahr eingeführt. Die im April vorgestellte GPU GP100 ist Grundlage des Chips Tesla P100. Als Speicher kommt beim Tesla P100 die zweite Generation von High Bandwidth Memory (HBM 2) zum Einsatz, die gegenüber dem Vorgänger HBM 1 und herkömmlichem GDDR-RAM wesentlich höhere Transfergeschwindigkeiten und mehr Speicher pro GPU ermöglicht.

Eine Neuerung der Pascal-Architektur ist auch das in Zusammenarbeit mit IBM entwickelte NVLink. Es ermöglicht den Datenaustausch zwischen CPU und GPU sowie zwischen mehreren Grafikprozessoren mit bis zu 80 GByte/s in jede Richtung. Das bisher verwendete PCI Express schafft lediglich 16 GByte/s.

Parallel hat Nvidia auch seine Chip-Plattform für In-Car-Systeme aktualisiert. Drive PX 2 soll etwa in dem selbstlenkenden Fahrzeug zum Einsatz kommen, das das chinesische Unternehmen Baidu entwickelt. Laut NVidia ermöglicht die Lösung automatisches Fahren auf mehrspurigen Autobahnen und Highways sowie HD-Kartendienste. Für Selbstlenktechnik kann sie Daten von Kameras, Radarsystemen, laserbasierter Sensoren (Lidar) und Ultraschallsensoren auswerten.

[mit Material von Chris Duckett, ZDNet.com]

Tipp: Wie gut kennen Sie die Chefs der IT-Firmen? Testen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Taugen Kryptowährungen als Unterstützer der Energiewende?

Bankhaus Metzler und Telekom-Tochter MMS testen, inwieweit Bitcoin-Miner das deutsche Stromnetz stabilisieren könnten.

10 Stunden ago

Supercomputer-Ranking: El Capitan überholt Frontier und Aurora

Mit 1,7 Exaflops ist El Capitan nun der dritte Exascale-Supercomputer weltweit. Deutschland stellt erneut den…

14 Stunden ago

Ionos führt neue AMD-Prozessoren ein

Der deutsche Hyperscaler erweitert sein Server-Portfolio um vier Angebote mit den neuen AMD EPYC 4004…

15 Stunden ago

Lags beim Online-Gaming? DSL-Vergleich und andere Tipps schaffen Abhilfe

Beim Online-Gaming kommt es nicht nur auf das eigene Können an. Auch die technischen Voraussetzungen…

16 Stunden ago

GenKI-Fortbildung immer noch Mangelware

Fast jedes zweite Unternehmen bietet keinerlei Schulungen an. In den übrigen Betrieben profitieren oft nur…

16 Stunden ago

Netzwerk-Portfolio für das KI-Zeitalter

Huawei stellt auf der Connect Europe 2024 in Paris mit Xinghe Intelligent Network eine erweiterte…

18 Stunden ago