SSE4: Wann bringt es wirklich mehr Speed?

Einen Durchbruch gab es mit SSE2. Diese Erweiterung erlaubt die Verwendung von Double-Precision-Zahlen. Da Double-Precision-Zahlen 64 Bit lang sind, können jeweils nur zwei Werte in ein XMM-Register gepackt werden.

SSE2 ist deutlich schneller als die Verwendung der 80×87-Befehle. Die 80×87-Register arbeiten intern mit 80 Bit, obwohl als Ergebnis immer nur das Standard-IEEE754-Double-Precision-Format mit 64 Bit zurückgegeben wird. SSE2 verzichtet auf die interne 80-Bit-Genauigkeit. Damit ist SSE2-Code zwar schneller, aber auch ungenauer. In der Praxis reicht die Genauigkeit jedoch meist aus, wenn man einige Dinge beachtet. SSE2 ist damit der erste vollwertige Ersatz für die 80×87-Floating-Point-Arithmetik auf Basis einer modernen SIMD-Architektur.

SSE3 stellt im Wesentlichen ein kleines Upgrade von SSE2 dar und bringt nur in wenigen Fällen Performancevorteile. Mit SSE3 ist es möglich, Addition und Subtraktion in einem Befehl zu mischen, was aber wenig praktische Relevanz hat. Ein weiteres Merkmal von SSE3 ist die Möglichkeit, einen 64-Bit-Wert in einem XMM-Register in beide 64-Bit-Hälften eines anderen XMM-Registers oder in den Speicher zu duplizieren. Dies hilft im Umgang mit komplexen Zahlen und bei Wellenformberechnung. Somit können typische DSP-Aufgaben, wie MP3-Kompression wesentlich beschleunigt werden. SSE3 erweitert den Befehlssatz um die horizontale Addition und Subtraktion. Dahinter verbirgt sich die Möglichkeit, verschiedene Felder eines einzigen XMM-Registers zu addieren und zu subtrahieren, anstatt jeweils ein Feld von zwei XMM-Registern.

Page: 1 2 3 4 5 6 7

ZDNet.de Redaktion

Recent Posts

DMA: EU stuft auch Apples iPadOS als Gatekeeper ein

Eine neue Analyse der EU-Kommission sieht vor allem eine hohe Verbreitung von iPadOS bei Business-Nutzern.…

5 Tagen ago

Chips bescheren Samsung deutlichen Gewinnzuwachs

Das operative Ergebnis wächst um fast 6 Billionen Won auf 6,64 Billionen Won. Die Gewinne…

6 Tagen ago

Chrome: Google verschiebt das Aus für Drittanbietercookies

Ab Werk blockiert Chrome Cookies von Dritten nun frühestens ab Anfang 2025. Unter anderem gibt…

6 Tagen ago

BAUMLINK: Wir sind Partner und Aussteller bei der Frankfurt Tech Show 2024

Die Vorfreude steigt, denn BAUMLINK wird als Partner und Aussteller bei der Tech Show 2024…

6 Tagen ago

Business GPT: Generative KI für den Unternehmenseinsatz

Nutzung einer unternehmenseigenen GPT-Umgebung für sicheren und datenschutzkonformen Zugriff.

7 Tagen ago

Alphabet übertrifft die Erwartungen im ersten Quartal

Der Umsatz steigt um 15 Prozent, der Nettogewinn um 57 Prozent. Im nachbörslichen Handel kassiert…

1 Woche ago