Zum 3DCenter Forum
Inhalt




Pentium 4 - Intel´s nächstes Desaster?

13. Oktober 2000 / von Leonidas / Seite 3 von 4


SSE2-Optimierung?

In den vorherigen Zeilen war immer wieder ein bisher nicht wesentlich näher erläuterter Begriff zu finden: SSE2-Optimierung. Hinter SSE2 verbirgt sich eine Befehlssatz-Erweiterung ähnlich MMX (Intel 1997, ab Pentium MMX) , 3DNow! (AMD 1998, ab K6-2), SSE (zuerst "ISSE" bezeichnet, Intel 1999, ab Pentium III) und Enhanced 3DNow! (AMD 1999, ab Athlon). SSE2 ist dabei wesentlich ausgeprägter als alle anderen vorgenannten Befehlssatz-Erweiterungen - und zum ersten Mal ist eine CPU auch regelrecht dafür designt wurden. Die zukünftige Bedeutung von SSE2 wird auch dadurch untermauert, daß Konkurrent AMD SSE2 in den eigenen zukünftigen CPUs unterstützen wird.

Der Pentium 4 hat sicher noch wesentlich mehr Eigenschaften als nur SSE2 - aber alles außer SSE2 steht jetzt schon unabänderbar fest. Die außergewöhnliche Bus- und Cache-Technologie, die virtuell doppelt so schnell arbeitenden ALUs, die superskalare 20-stufige Befehls-Pipeline - das sind die eigentlichen Key-Features des P4. Aber dies sind fest verdrahtete Sachen - falls sich jetzt zum Beispiel die lange Pipeline als Hindernis herausstellt, so ist dies nicht mehr zu ändern. Zwar ist auch SSE2 in dem Sinne "hart verdrahtet" - aber SSE2 wird erst von denjenigen Programmierern zum Leben erweckt, welche SSE2 in ihre Arbeit einfließen lassen. Hier liegt der entscheidende Punkt, in welchem der Pentium 4 noch zu legen kann und auch zulegen wird müssen.

Nun gut - das SSE2 wohl die Zukunft gehören wird, muß den Käufer eines P4-Systems im Jahre 2000 des Herrn nicht interessieren - schließlich ist die Welt jetzt, hier und heute. Wie wir an den vorangegangenen Benchmarks feststellen konnten, fehlen dem Pentium 4 - bei angenommener gleicher Taktfrequenz - noch einige Prozente, um überhaupt so schnell wie die Vorgängergeneration zu sein. Genau an diesem Punkte kommt nun die SSE2-Optimierung ins Spiel. Dazu müßte ein Programm, gleich welcher Art es ist, für SSE2 im Prinzip neu geschrieben werden. Dabei gibt es zwei wesentliche Ansatzpunkte: Die Treiber und die Software.

Gern wird in diesem Zusammenhange auch der Vergleich zum Pentium Pro gezogen, welcher als neue CPU ebenfalls in manchen Anwendungen langsamer als ein damals technologisch unterlegener Pentium-Prozessor war. Ich würde diesen Vergleich nur mit äußerster Vorsicht ziehen! Der Pentium Pro hatte als reine 32Bit-CPU Probleme mit 16bittigen Programmen, ähnlich wie der P4 heuer mit nicht-SSE2-optimierter Software - soweit die Gemeinsamheiten.

Damals bestand aber die Situation, daß dem Pentium Pro ganz automatisch der Fortschritt in Form von vielen verfügbaren 32bittigen Anwendungen zufloß. Windows 95 ist im gleichen Jahr released worden und damit war der Weg für Programmierer hin zu reinem 32bittigen Code prinzipiell schon vorgezeichnet. Noch dazu, wo ein 32bittiger Code und vor allem ein 32bittiger Adreßraum für die Programmierer selber einen Vorteil bedeutenden - der Eigenantrieb war da. Heutzutage ist niemand gezwungen, seine Software auf den P4 zu optimieren.

Erster Ansatzpunkt für SSE2: Die Treiber. Wobei dies vorwiegend die Grafikkarten-Treiber betrifft. nVidia hat zum Beispiele den 5er Detonator für SSE2 komplett neu geschrieben, was dann im 6er Detonator resultierte. Andere Grafikkarten-Hersteller werden da folgen - wahrscheinlich sogar schnell folgen, da Intel P4-Systeme schon vor einiger Zeit zu den Entwicklern gekarrt hat. Mit Treiber-Optimierung lassen sich wohl die meisten Zugewinne erreichen - allein, weil die Grafikkarten-Hersteller ja ihre Karten in den Benchmarks möglichst weit vorn sehen wollen und damit entsprechend viel Eigeninitiative entwickeln. Möglich sind im Normalfall Zugewinne von um die 10 bis 30 Prozent - nur daß diese sich über den Zeitraum von mehreren Treiber-Versionen und damit also von Monaten erstrecken werden.

Ähnliches passierte seinerzeit ja schon einmal bei AMD´s 3DNow! und den nVidia- und 3dfx-Treiber. Eine Unbekannte ist in dieser Gleichung das "alte" SSE1 - niemand kann momentan eine vernünftige Schätzung abgeben, wo hoch die Zugewinne von den momentan SSE1-optimierten auf die folgenden SSE2-optimierten Treiber sein werden können. Im besten Fall so wie von unoptimiert auf 3DNow! (+25%), im schlimmsten Fall gar nichts. Anzumerken wäre hier, daß auch die heutzutage 3DNow!-optimierten Grafikkarten-Treiber dem K6-2/III in den heutigen Spielen nicht mehr weiterhelfen und die altbekannte FPU-Schwäche dieser CPUs wieder voll durchbricht. Diese Erfahrung aus der Vergangenheit - daß sich auch mit den optimiertesten Treibern eine echte FPU-Schwäche nicht dauerhaft kaschieren läßt, wirft natürlich kein gutes Licht auf den Pentium 4 mit seiner geringer ausfallenden, aber doch vorhandenen FPU-Schwäche.






zurueck               weiter    

Shortcuts
nach oben