Pentium 4 - Intel´s nächstes Desaster?
13. Oktober 2000 / von Leonidas / Seite 4 von 4
SSE2-Optimierung? (2)
Zweiter Ansatzpunkt für SSE2: Die Software. Hier liegen dann sicher die eigentlichen Bemühungen seitens Intel zur Durchsetzung von SSE2. Und für den Endkunden liegen hier auch die größen Unbekannten. Wieviel Prozent aller Programme werden denn auf SSE2 optimiert? Und bei wievielen steht diese Optimierung nur auf der Verpackung und wieviele haben sie auch wirklich - geschwindigkeitsbringend - "eingebaut"? Und bewegen sich die Gewinne auch oberhalb von ein paar lächerlichen Prozenten?
Nun - im Gegensatz zu den Grafikkarten-Treibern ist dies wie gesagt ein sehr unsicheres Feld. Letztendlich passiert ohne Intels massive Bemühungen durch Unterstützung und Support der Programmierer-Gemeinde gar nichts. Denn für die Programmierer bedeutet SSE2 erst einmal mehr Arbeit. Nicht nur, daß es erlernt werden müßte - auch Code-Teile, welche man als ausgereift bezeichnet und gern wieder verwendet, müssten nun von Grund auf neu geschrieben werden, um ernsthaft Geschwindigkeit herauszuholen. Der entscheidende Punkt hier ist nicht, daß dies nicht getan werden wird - vielmehr geht es um das "wann". Die Einführung von SSE2 in Windows-Standardsoftware ist eine Sache von Jahren.
Wir sehen das heuer sehr deutlich an MMX - erst ein paar Jahre nach Markteinführung ist die Mehrzahl der dafür in Frage kommenden Produkte auf MMX optimiert. Und von der damaligen Zielsetzung, daß MMX der alleinige Seligmacher sein sollte, ist man meilenweit entfernt und wird es auch immer bleiben. Schließlich hat sich die Welt in Form von SSE und SSE2 weitergedreht. Hier wird Intel im übrigen bei einigen Programmierern das eigene Entwicklungstempo zum Verhängnis: "Warum etwas aufwendig auf SSE2 optimieren, wenn Intel uns in ein paar Jahren wieder etwas anderes andrehen wird?" werden einige von Ihnen sagen.
Wenn man die Erfahrungen mit MMX und SSE betrachtet, werden wir wohl viele Produkte (ob Spiele oder Anwendungssoftware) erleben, welche ein SSE2-Logo führen, aber mehr oder weniger unoptimiert sind. Um SSE2 richtig auszunutzen, müßte man das komplette Programm entsprechend direkt auf SSE2 schreiben. Und dazu müßte man SSE2 schon einem frühen Projektzeitraum in seine Kalkulation einbeziehen können - was wohl nur auf Produkte zutreffen wird, die erst in ein bis zwei Jahren (!) released werden. Allerdings ist aus heutiger Sicht nicht von komplett in SSE2 geschriebenen großen Programmen auszugehen - dies hat es in der Vergangenheit mit den bisherigen Befehls-Erweiterungen auch nicht gegeben.
Es ist vielmehr davon auszugehen, daß insbesondere in Spielen kleinere Teile der Engine SSE2-optimiert werden. Große (Performance-)Sprünge sind da allerdings überhaupt nicht zu erwarten. Sinn macht wirklich nur eine echte, von Hand geschrieben Optimierung wie seinerzeit die 3DNow!-Optimierung für Quake 2, welche einem K6-2/V2-System durchaus 40 bis 60 Prozent mehr Leistung in Q2 entlocken konnte. Dies blieb jedoch ein Einzelfall, sozusagen ein Demonstrations-Objekt seitens AMD. Möglich, daß es die auch bei SSE2 gibt - aber die Normalität wird das nicht darstellen. Man muß leider davon ausgehen, daß - obwohl aus optimierter Software das meiste an Performance herauszuholen wäre - diese Möglichkeit wohl kaum genutzt werden wird bzw. sich erst nach Jahren in geringem Umfang durchsetzen wird.
Rein auf der Seite der Anwendungssoftware ist es allerdings zu erwarten, daß kleinere Programme, wie zum Beispiel MP3-Player und auch Multimedia-PlugIns wohl ziemlich schnell und ziemlich gut auf SSE2 optimiert werden. Denn diese Programme sind meist nicht sehr komplex und können meist ziemlich gut auch von nicht ganz perfekten Optimierungen profitieren. Außerdem ist der "Markt" dieser Multimedia-Programme und -PlugIns ständig in Bewegung und so zwingen sich die einzelnen Anbieter gegenseitig immer wieder zu weiteren Höchstleistungen.
Schlechter sieht es bei komplexerer Anwendungssoftware aus - auf diese treffen die gleichen Erkenntnisse und Erfahrungen wie im Bereich "Spiele" zu. Mit Sicherheit werden die ganzen theoretischen Anwendungsperformance-Tester ziemlich schnell SSE2-optimiert, aber danach? Niemand schreibt Programme wie Microsoft Office nur wegen ein paar Prozent Geschwindigkeit um - wenn in derselben Zeit, welche diese Optimierung die Progammier bindet, die verfügbare Rechnenleistung in Form des Angebots der PC-Hersteller längst um die gleiche Menge gestiegen ist.
Fazit
Ich will den entgültigen Betrachtungem zum Serien-Produkt nicht vorgreifen - aber: Der Pentium 4 wird es sehr schwer haben. Aus den Benchmark-Ergebnissen sind eindeutige Schwächen über alle Bereiche herauslesbar, genauso aber, daß der P4 bei optimierter Software (Q3A, wenn auch nur auf SSE1 optimiert) entsprechend punkten kann. Hier können nur weitere SSE2-Optimierungen helfen. Bei den Grafikkarten-Treibern ist da kein Problem zu sehen, aber SSE2-optimierte Anwendungssoftware und -Spiele werden zum einen noch auf sich warten lassen und zum anderen ist aus Erfahrung nicht diese Art Optimierung zu erwarten, die auch wirklich das letzte Stück Leistung aus der P4-Architektur herauskitzelt.
Sehr viel vom Wohl und Wehe des Pentium 4 wird also von Umfang und der Qualität der SSE2-Optimierungen entschieden werden - zu viel für meinen Geschmack. Über diesen dato unsicheren Punkt SSE2 hinaus sieht es leider noch düsterer bezüglich des P4 aus - die reine Rechenleistung wird aller Wahrscheinlichkeit nach geringer ausfallen als beim Vorgänger Pentium III oder beim Kontrahenten Thunderbird. Der P4 wird sich seinen Vorsprung wohl nur durch die höhere Taktrate sichern. Ob das Sinn von neuen Prozessorgenerationen ist, steht zu bezweifeln.
Related Links:
Pentium 4 Benchmarks -
Fake oder Fakt? (deutsch)
[Roland Neumeier]
Benchmark Preview
Intel P4 (d)
[LCM-Network]
Pentium 4: Neue Plattform,
neue Probleme (d)
[tecChannel]
New Pentium 4 Benchmarks Revealed (english)
[Ace´s Hardware]
Intel's NetBurst Architecture -
The Pentium 4's innards get a name (e)
[AnandTech]
Intel Pentium 4 Willamette
Preview (e)
[SysOpt]
Willamette
Update (e)
[RealWorld Technologies]