SSE4: Wann bringt es wirklich mehr Speed?

SSE4 besitzt eine Menge Potential, die Verarbeitungsgeschwindigkeit drastisch zu erhöhen. Dies gilt zwar vor allem für das ab Herbst 2008 verfügbare SSE4.2, aber auch die Performancesteigerung durch SSE4.1 ist durchaus bemerkenswert und kann mit der von SSE2 verglichen werden.

Insbesondere die Insert- und Extract-Befehle ermöglichen vielen Anwendungen die effiziente Verwendung von SIMD-Befehlen, da damit sehr flexibel mit Daten umgegangen werden kann, die zur vektorisierten Verarbeitung geeignet sind. Doch ein erster Praxistest fällt enttäuschend aus. Dazu wurde der Raytracer Persistance of Vision in der Version 3.6 mit dem Intel-Compiler 10 mit SSE4.1 kompiliert. Das Ergebnis ist eine um 16 Prozent langsamere Version als die mit gleichem Compiler erstellte SSSE3-Version. Gegenüber SSE2 war die SSE4.1-Version 17 Prozent langsamer.

Dies liegt zum einen daran, dass der Intel-Compiler 10 als erste Version SSE4 unterstützt, jedoch bereits vor Erscheinen des ersten Prozessors mit SSE4 erschien. Somit fehlt für den Optimizer noch eine ganze Reihe an Praxiserfahrung, die unverzichtbar ist, um effizienten Code zu generieren. Zum anderen muss der Entwickler für effizienten Code immer die Möglichkeiten des Befehlssatzes im Hinterkopf behalten. Auch wenn er in C++ die Prozessorbefehle nicht direkt nutzt, sollte der Entwickler stets ein Verständnis dafür haben, wann Abläufe vektorisiert werden können.

Nichtsdestotrotz muss Intel seinen Compiler noch gewaltig verbessern. Eine SSE4-Version darf auf keinen Fall langsamer sein als eine SSSE3- oder SSE3-Version. Im Zweifel muss der Compiler auf SSE4 ganz verzichten. Bei effizientem Einsatz der Insert- und Extract-Befehle hätte sich eine Performancesteigerung ergeben müssen. Offensichtlich wird die Ausführungsgeschwindigkeit von optimiertem SSE4-Code in der Compiler Version 10 noch falsch bewertet.

Page: 1 2 3 4 5 6 7

ZDNet.de Redaktion

Recent Posts

Fünf auf einen Streich: Baseus Nomos 5-in-1 Desktop Charger Qi2 140W

Das weltweit erste 5-in-1-Tischladegerät mit kabelloser Qi2-Aufladung und einziehbarem Kabel.

2 Wochen ago

RansomHub hebt Datenerpressung auf höhere Stufe

RansomHub kann per Fernverschlüsselung über ein einziges ungeschütztes Endgerät Daten im gesamten Netzwerk verschlüsseln.

2 Wochen ago

Shokz OpenRun Pro 2: Die perfekte Kombination aus Knochenschall und Air-Conduction Technik

Die neuen OpenRun Pro 2 von Shokz sind die neueste Weiterentwicklung der beliebten offenen Sportkopfhörer.…

2 Wochen ago

UPDF: PDF-Software zu einem Viertel des Preises von Adobe

PDF-Bearbeitungssoftware jetzt im Black Friday Sale mit 50 Prozent Rabatt!

2 Wochen ago

Neuer Bedarf an Workplace Services durch DEX und KI

ISG untersucht deutschen Workplace-Services-Markt. Digital Employee Experience (DEX) gilt als Schlüssel für neues Wachstum.

2 Wochen ago

SEO-Beratung von Spezialisten wie WOXOW: Deshalb wird sie immer wichtiger

Wer bei Google mit den passenden Suchbegriffen nicht in den Top-Rankings gefunden wird, der kann…

2 Wochen ago