SSE4: Wann bringt es wirklich mehr Speed?

SSE4 besitzt eine Menge Potential, die Verarbeitungsgeschwindigkeit drastisch zu erhöhen. Dies gilt zwar vor allem für das ab Herbst 2008 verfügbare SSE4.2, aber auch die Performancesteigerung durch SSE4.1 ist durchaus bemerkenswert und kann mit der von SSE2 verglichen werden.

Insbesondere die Insert- und Extract-Befehle ermöglichen vielen Anwendungen die effiziente Verwendung von SIMD-Befehlen, da damit sehr flexibel mit Daten umgegangen werden kann, die zur vektorisierten Verarbeitung geeignet sind. Doch ein erster Praxistest fällt enttäuschend aus. Dazu wurde der Raytracer Persistance of Vision in der Version 3.6 mit dem Intel-Compiler 10 mit SSE4.1 kompiliert. Das Ergebnis ist eine um 16 Prozent langsamere Version als die mit gleichem Compiler erstellte SSSE3-Version. Gegenüber SSE2 war die SSE4.1-Version 17 Prozent langsamer.

Dies liegt zum einen daran, dass der Intel-Compiler 10 als erste Version SSE4 unterstützt, jedoch bereits vor Erscheinen des ersten Prozessors mit SSE4 erschien. Somit fehlt für den Optimizer noch eine ganze Reihe an Praxiserfahrung, die unverzichtbar ist, um effizienten Code zu generieren. Zum anderen muss der Entwickler für effizienten Code immer die Möglichkeiten des Befehlssatzes im Hinterkopf behalten. Auch wenn er in C++ die Prozessorbefehle nicht direkt nutzt, sollte der Entwickler stets ein Verständnis dafür haben, wann Abläufe vektorisiert werden können.

Nichtsdestotrotz muss Intel seinen Compiler noch gewaltig verbessern. Eine SSE4-Version darf auf keinen Fall langsamer sein als eine SSSE3- oder SSE3-Version. Im Zweifel muss der Compiler auf SSE4 ganz verzichten. Bei effizientem Einsatz der Insert- und Extract-Befehle hätte sich eine Performancesteigerung ergeben müssen. Offensichtlich wird die Ausführungsgeschwindigkeit von optimiertem SSE4-Code in der Compiler Version 10 noch falsch bewertet.

Themenseiten: Anwendungsentwicklung, Intel, Software

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu SSE4: Wann bringt es wirklich mehr Speed?

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *