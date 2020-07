Linux-Kernel-Entwickler Linus Torvalds schreckt nicht vor harten Worten zurück. Er hofft auf das Ende von Intels 512-Bit-Vektor-Erweiterungen und gibt zu, dass er einen „irrationalen Hass“ auf die Fließkomma-Benchmarks (FP) hat, die damit verifiziert werden sollen.

Torvalds feuerte seine Kritik am Intel Advanced Vector Extensions 512 (Intel AVX-512) in einem Mailinglisten-Chat ab. Er reagierte damit auf einen Artikel von Michael Larabel. Dieser bemängelte die Unterstützung für AVX-512 in den Compiler-Anweisungen, die Intel für Alder Lake, seine 2021-Prozessoren für den Desktop, aktiviert hat, in der GNU Compiler Collection 11. Intels zukünftige Xeon Sapphire Roads-Prozessoren unterstützen immer noch AVX-512.

„Ich hoffe, dass AVX-512 einen schmerzhaften Tod stirbt und dass Intel beginnt, echte Probleme zu beheben, anstatt mit Tricks zu versuchen, Benchmarks zu erstellen, auf denen sie gut aussehen können“, schrieb Torvalds. Torvalds beanstandet Intels Fokus auf FP-Benchmarks und die Leistung seiner Prozessoren auf Supercomputern oder Hochleistungscomputern (HPCs).

„Ich hoffe, dass Intel zu den Grundlagen zurückkehrt: ihren Prozess wieder zum Laufen bringt und sich mehr auf normalen Code konzentriert, der nicht HPC oder ein anderer sinnloser Sonderfall ist.“ Er merkt an, dass in der Blütezeit von x86 Intels Rivalen bei FP-Lasten immer besser abgeschnitten haben.

„Intels FP-Leistung war relativ gesehen schlecht, und es war nicht ein Jota wichtig. Denn außerhalb der Benchmarks interessierte sich absolut niemand dafür“, erklärte Torvalds. „Dasselbe gilt jetzt – und in Zukunft – weitgehend auch für AVX-512. Ja, man kann Dinge finden, die es betrifft. Nein, diese Dinge verkaufen keine Maschinen im großen Rahmen.“ Die AVX512 habe echte Nachteile. „Ich würde es viel lieber sehen, dass das Transistor-Budget für andere Dinge verwendet wird, die viel relevanter sind. Auch wenn es immer noch FP-Mathematik ist (in der GPU, statt AVX-512). Oder geben Sie mir einfach mehr Kerne (mit guter Single-Thread-Leistung, aber ohne den Müll wie beim AVX-512), wie es AMD getan hat.“

„Ich möchte, dass meine Leistungsgrenzen mit regulärem Integer-Code erreicht werden, nicht mit irgendeinem AVX-512-Power-Virus, der die Spitzenfrequenz wegnimmt (weil die Leute ihn schließlich für memcpy verwendet haben!) und Kerne wegnimmt (weil dieser nutzlose Müll Platz frisst)“, fuhr Torvalds fort.

„Ja, ja, ich bin voreingenommen. Ich verabscheue FP-Benchmarks absolut, und mir ist klar, dass andere Leute sich sehr darum sorgen. Ich denke einfach, dass AVX-512 genau das Falsche ist. Es ist ein Lieblingsärgernis von mir. Es ist ein Paradebeispiel für etwas, das Intel falsch gemacht hat, teilweise dadurch, dass es die Fragmentierung des Marktes nur noch verstärkt hat. Hören Sie mit dem Müll auf, und lassen Sie all die Dinge, um die sich jeder kümmert, so gut laufen, wie es Ihnen menschlich möglich ist.“

In einer separaten E-Mail betonte Torvalds, dass er einen „irrationalen Hass auf Vektoreinheiten und FP-Benchmarks“ habe. „Ich denke, dass sie größtenteils eine völlige Verschwendung von Transistoren und Aufwand sind, und ich denke, dass die Menge an Zeit, die dafür aufgewendet wurde – sowohl von Hardware-Leuten als auch von Software-Leuten, die versuchen, sie zu benutzen – größtenteils Zeitverschwendung war“, schrieb er.

Cloudflare: „AVX-512 abschalten“

Neben Torvalds und Phoronix hat auch die Web-Infrastruktur-Firma Cloudflare sich mit AVX-512 beschäftigt. Nach Leistungsanalysen emfiehlt sie Kunden, die die Befehlssatzerweiterung nicht für Hochleistungsaufgaben benötigen, auf dem Server und Desktop zu AVX-512 zu deaktivieren, um eine „versehentliche“ Drosselung zu vermeiden.

Basis für diese Entscheidung ist Cloudflares Beobachtung, dass der Intel-Chip seine Frequenz drosselt, wenn er AVX-Code ausführt, sodass andere Anwendungen entsprechend langsamer ablaufen. „Es ist schwer zu sagen, wie stark jeder Kern zu einem bestimmten Zeitpunkt gedrosselt wird, aber bei einigen Tests mit lscpu habe ich herausgefunden, dass beim Ausführen des openssl speed -evp chacha20-poly1305 -multi 48-Benchmarks 1199.963 MHz angezeigt wird, für OpenSSL mit allen AES-GCM-Verbindungen erhielt ich 2399.926 MHz und für OpenSSL mit allen ChaCha20-Poly1305-Verbindungen wurden 2184.338 MHZ angezeigt. … Wenn Sie AVX-512 für einige spezielle Hochleistungsaufgaben nicht benötigen, schlage ich vor, dass Sie die AVX-512-Ausführung auf Ihrem Server oder Desktop deaktivieren, um eine versehentliche Drosselung durch AVX-512-Code zu vermeiden.“

Grundsätzlich begrüßt Cloudflare die Befehlssatzerweiterungen von Intel. Gleichzeigt schränkt es aber auch ein: „Aber wenn das Problem der Frequenzskalierung bis dahin nicht gelöst ist, wird die Verwendung dieser für allgemeine Kryptographie-Bibliotheken (viel) mehr schaden als nützen.“