SSE4: Wann bringt es wirklich mehr Speed?

Mit den neuen Rundungsbefehlen können Fließkomma-Werte auf ihren entsprechenden Integer-Wert gerundet werden. Dies ist sinnvoll, wenn das Ergebnis immer ein Integer sein muss, wie beispielsweise bei den Farbwerten eines Pixels, zur Berechnung aber Floating-Point-Arithmetik erforderlich ist. Bemerkenswert ist die Einführung von Insert- und Extract-Befehlen. Bis einschließlich SSSE3 können die 128-Bit-XMM-Register immer nur mit im Speicher zusammenhängenden Werten versorgt werden. Soll ein XMM-Register mit vier 32-Bit-Werten beschrieben werden, um vier Rechenoperationen gleichzeitig auszuführen, müssen diese zwangsläufig direkt hintereinander im Speicher stehen.

Wenn dies nicht der Fall ist, müssen die Werte via 32- oder 64-Bit-x64-Register erst umkopiert werden. In vielen Fällen ist diese umständliche Prozedur langsamer, als die Rechenoperation viermal einzeln durchzuführen. Mit den Insert- und Extract-Befehlen ist es nun möglich, dass einzelne Felder der XMM-Register aus einer beliebigen Speicheradresse gelesen oder wieder dorthin geschrieben werden können, was besonders Anwendungen zugutekommt, die aufgrund ihrer Datenstruktur bisherige Befehlssatzerweiterungen nur sehr begrenzt nutzen konnten.

Geschwindigkeitsvorteile durch SSE4 sind dann vor allem bei Anwendungen mit komplexer Datenstruktur und hohem Rechenerfordernis zu erwarten – beispielsweise große Kalkulationstabellen. Neben diesen allgemeinen Befehlen, die den Löwenanteil an der Performancesteigerung haben, bietet SSE4.1 auch eine Reihe spezialisierter Befehle. Der MPSADBW-Befehl bildet die Summe acht absoluter 8-Bit-Differenzen. So etwas ist sinnvoll bei der Bewertung der Qualität von komprimierten Formaten wie JPEG, MPEG oder MP3. Bieten sich mehrere Möglichkeiten der Kompression an, so kann die Abweichung des komprimierten Datenstroms vom Original mittels MPSADBW-Befehl berechnet werden.

Dot-Product-Befehle erlauben das selektive Multiplizieren mehrerer Werte gleichzeitig und deren anschließende Aufsummierung. Hiervon profitieren 3D- und Gaming-Anwendungen. Blend-Befehle ermöglichen das selektive Kopieren von einzelnen Werten eines XMM-Register in ein anderes. Damit lassen sich vektorisierte Daten mischen, was vor allem bei der Bildbearbeitung von Bedeutung ist.

Page: 1 2 3 4 5 6 7

ZDNet.de Redaktion

Recent Posts

Kostenloser Dekryptor für ShrinkLocker

Mit dem Dekryptor von Bitdefender können Opfer von Attacken mit der Shrinklocker-Ransomware Dateien wiederherstellen.

1 Woche ago

Malwarebytes warnt vor Betrugsmaschen beim Weihnachtseinkauf

In der Vorweihnachtszeit ist vor allem Malvertising auf dem Vormarsch. Cyberkriminelle locken Nutzer über schädliche…

1 Woche ago

Bedrohungsindex: Deutliche Zunahme von Infostealern im Oktober

Dazu trägt unter der Infostealer Lumma-Stealer bei. Hierzulande dominiert der Infostealer Formbook die Malware-Landschaft.

1 Woche ago

Chrome 131 schließt zwölf Sicherheitslücken

Eine schwerwiegende Anfälligkeit hebelt die Sicherheitsfunktion Seitenisolierung auf. Betroffen sind Chrome für Windows, macOS und…

1 Woche ago

DeepL Voice mit KI für Sprach- übersetzungen

DeepL Voice ermöglicht Live‑Übersetzung von Meetings und Gesprächen in 13 Sprachen.

1 Woche ago

November-Patchday: Microsoft schließt Zero-Day-Lücken in Windows

Betroffen sind Windows und Windows Server. Microsoft patcht aber auch Schwachstellen in Excel, Word und…

1 Woche ago