Sandy-Bridge-Prozessoren: Warum sie so schnell sind

Kein Fused Multiply Add

Die ursprünglich angedachte Unterstützung für Fused Multiply Add hat Intel in Sandy Bridge nicht implementiert. Sie soll Gerüchten zufolge erst mit Haswell kommen. Andere Gerüchte sprechen davon, dass dies bereits bei Ivy Bridge der Fall sein wird. Dabei wird eine Multiplikation mit einer Addition kombiniert, was in der Praxis sehr häufig vorkommt. Hauptvorteil dabei ist, dass nur einmal gerundet wird. Führt man Addition und Multiplikation getrennt aus, kommt es zu zwei Rundungsvorgängen und das Ergebnis wird ungenauer.

Beim Rechnen mit sehr langen Zahlen kann man durch Fused Multiply Add mehr Stellen des Ergebnisses als richtig annehmen und spart auf diese Weise Schritte, was wiederum zu einer höheren Geschwindigkeit führt.

Intel setzt dabei auf eine FMA3-Implementierung mit drei Operatoren, also a=a+b*c. Der Operand a wird bei der Berechnung zerstört. AMD hat unterdessen angekündigt, mit seinem Bulldozer-Core eine FMA4-Implementierung in der Form d=a+b*c zu unterstützen. Sie ist mit Intel inkompatibel. Bisher haben sich zu Intel inkompatible Befehle, etwa 3D Now, in Standard-Applikationen nicht durchgesetzt.

Einschränkungen für 32-Bit-Programme

Etwas unverständlich ist Intels Strategie bei der Einführung von AVX für 32-Bit-Programme. Auch im 32-Bit-Speichermodell lassen sich jetzt 256 Bit breite SIMD-Register nutzen, allerdings nur YMM0 bis YMM7. Da die Betriebssysteme ohnehin Unterstützung für AVX implementieren müssen, hätte man auch die Register YMM8 bis YMM15 freischalten können, wenn das Betriebssystem AVX für 32-Bit-Prozesse freigibt.

Da jede Software ohnehin auf AVX-Unterstützung prüfen muss, dürfte es anders als mit den GPR-Registern r8 bis r15 nicht zu Problemen durch schlecht gemachte Featureprüfung der CPU kommen.

Themenseiten: Chipsätze, Client & Desktop, Desktop, Grafikchips, Intel, Notebook, Prozessoren

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

1 Kommentar zu Sandy-Bridge-Prozessoren: Warum sie so schnell sind

Kommentar hinzufügen
  • Am 8. Januar 2011 um 1:26 von Tester

    Sandy Bridge RAM
    Im Artikel wird mit verweis auf die Benchmarks gesagt, daß die Dual-Channel Speicher Anbindung der Sandy Bridge mehr Durchsatz als die Tripple Channel der i7-9xx bieten soll. In den Benchmarks wird die Top-Sandy Bridge CPU aber nur mit älteren Dual-Channel CPUs verglichen die alle samt nur Dual Channel fähig sind. Dazu kommt noch, daß wohl kaum noch einer einen 1066MHZ langsamen Speicher mit einer Tripple Channel fähigen CPU verbaut. Der Artikel lässt einen in dem Glauben bei 1066MHz bzw. 1333MHz wäre das endgültige der Speichergeschwindigkeit nur weil bis dahin eine offizielle unterstützung gegeben ist. Ein sinnvoller Vergleich wäre also mal eine 2600K CPU gegen einen 950 oder höher mit Tripple Channel antreten zu lassen. Aber beide mit nem zeitgemäßen 2000MHz Speicher.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *