Zum 3DCenter Forum
Inhalt




Pentium 4 - Leistungsfragen

24. April 2002 / von aths & Leonidas / Seite 3 von 3



   Stärke: geringe Latenzzeiten und hohe Bandbreite

Vergleicht man den Athlon mit dem Pentium 4, so scheint der AMD-Prozessor cachemäßig im Vorteil: 64 kByte LeveLevel1-Cache sowohl für Daten als auch noch einmal für Befehle (insgesamt also 128 kByte) stehen 8 kByte LeveLevel1-Cache für Daten und 12000 bereits dekodierten Befehlen beim Pentium 4 gegenüber.

Warum ist der Level1-Cache beim Pentium 4 aber so klein? Das liegt daran, dass sich bei kleineren Caches niedrigere Latenzzeiten realisieren lassen. Das bedeutet, beim Pentium 4 ist zwar die Wahrscheinlichkeit, aus dem Level1-Cache lesen zu können (und so den Zugriff auf den Level2-Cache oder gar den RAM zu umgehen) kleiner. Dafür ist der Zugriff dann schneller, wenn aus dem Level1-Cache gelesen werden kann.

Der Level2-Cache ist beim Pentium 4 zudem so organisiert, dass er sich sehr wenig verschätzt - also fast immer alle benötigten Daten vorrätig hat. Ausserdem ist die Bandbreite zum Cache gegenüber dem Athlon deutlich höher und übernimmt damit eigentlich schon Aufgaben des Level1-Caches. Tatsächlich ist der Level2-Cache beim Athlon eher als Schmuck zu sehen - eine Deaktivierung ergibt dank des starkem Level1-Caches nur relativ wenig Performance-Verlust.

Ein weiterer Vorteil ist bei den Bandbreiten zum Chipsatz und damit zum RAM zu sehen. Der Pentium III liegt mit 133 MHz FSB bei ungefähr 1 GB/sec Bandbreite. Der Athlon bringt es auf ca. 2 GB/sec, der Pentium 4 auf 3 GB/sec, beim zukünftigen 133-MHz-FSB-Northwood sind es sogar 4 GB/sec. Selbst der zukünftige K8 Clawhammer mit 166 MHz FSB wird nur 2,5 GB/sec bieten können.

Auf diese Bandbreite kommt es gerade bei Medien-Verarbeitung an. Hier hat der Pentium 4 dank SSE2 wie schon beschrieben seine Stärken. Es sollte allerdings nicht unerwähnt bleiben, dass Bandbreite nicht alles ist. RDRAM (RAMBUS) glänzt zwar durch pure Übertragungsgeschwindigkeit, leidet aber an den hohen Latenz-Zeiten. Das kann sich je nach Einsatzgebiet im Vergleich mit DDR-RAM auch negativ auswirken. Allerdings profitiert der Pentium 4 in der Regel eher von höheren Bandbreiten als niedrigen Latenzzeiten. Einfachen SDRAM sollte man daher auf keinen Fall beim Pentium 4 verwenden. Denn die Pentium 4 Architektur bietet einerseits hohe Bandbreiten, ist andererseits aber auf diese auch angewiesen.



   Handicap: notwendige Befehlscode-Optimierungen

Der Pentium 4 performt mit herkömmlicher Software nur dank seiner hohen Taktfrequenzen noch ganz gut. Er ist auf spezielle Optimierungen angewiesen, um den Pro-MHz-Nachteil wenigstens zum Teil etwas auszugleichen. Einerseits könnte man Intel-Compiler mit SSE2-Support verwenden. Dann allerdings würden die Programm zu anderen Prozessoren inkompatibel. Eine weitere Optimierungsmöglichkeit besteht darin, Rücksicht auf die extrem lange Pipeline zu nehmen.

Denn wenn unvorhergesehene Sprünge auftreten, sind letztlich alle Befehle und Daten in der Pipeline wertlos - sie muss neu geladen werden. Mittels bestimmter Techniken lassen sich solche Situationen auf ein Mindestmaß reduzieren. Ausserdem ist es mit bestimmten Compilern möglich, die Cache-Architektur des Pentium 4 zu berücksichtigen, um eine bessere Trefferwahrscheinlichkeit zu erreichen. Der Pentium 4 besitzt zum Glück eine gute Sprungvorhersage, um die Wartezeiten durch das komplette Neuladen der Pipeline möglichst zu verhindern. Eine softwareseitige Optimierung ist dennoch dringend anzuraten.

Allerdings ist dies auch nicht unproblematisch. Ohne in die wirklichen Tiefen der CPU-Technik gehen zu wollen, sei folgendes gesagt: Alle herkömmlichen CPUs profitieren von einer bestimmten Befehlscodefolge-Optimierung - welche sich aber speziell auf dem Pentium 4 deaströs auswirkt. Solche ausgetüftelten Optimierungen berücksichtigen auch die Eigenarten der Decoder.

Die Abhängigkeit von der spezieller Pentium 4 Optimierung wird auch bei normalen Rechenvorgängen deutlich. Andere moderne CPUs besitzen extra schnelle Optimierungs-Einheiten direkt in der Hardware. Damit werden z.B. komplexe Multiplikationen so zerlegt, dass sie schneller zu berechnen sind. Wenn diese Zerlegung nicht schon vom Programmierer vorgenommen wurde, so weicht der Pentium 4 auf eine langsame Optimierungs-Methode aus. Intel geht also den eher risikoreichen Weg, eine CPU herzustellen, deren Wohl und Wehe stark von den Optimierungs-Anstrengungen der Software-Anbietern abhängt.

Der Zugriffe auf Register wurde ebenfalls nicht optimal gelöst. Es galt hier eine Art Bug zu vermeiden, welcher bis Pentium III "aktiv" war. Dieser lieferte zwar keine falschen Ergebnisse, aber hin und wieder unnötig lange Wartezeiten. Dieser Bug ist nun beim Pentium 4 nicht mehr vorhanden. Allerdings zu dem Preis, dass für Register-Zugriffe die Integer-Einheit für komplexe Funktionen gefordert ist.

Dazu eine kleine Randbemerkung: Um Prozessoren speziell für Multitasking zu optimieren, wurde die Hardware verbessert. CPUs nutzen Register, das sind einige Handvoll Speicherplätze direkt im Chip. Es ist inzwischen usus geworden, einer CPU in Hardware mehr Register zu spendieren, als aus logischer Sicht vorhanden sind. Der Prozessor spiegelt automatisch die Inhalte, um beim Task-Switching die Register nicht immer auslagern zu müssen - denn das wäre in der Praxis der Leistungstod. Durch die historische Entwicklung setzen sich Register aus Unterregister zusammen, und das kann bei Spiegelungen zu Problemen führen. Der Athlon hat dank seiner Architektur diese Probleme nicht.

Pentium 4 Optimierungen, ohne allerdings SSE2-Befehle, können unter Umständen auch auf anderen CPUs die Ausführungsgeschwindigkeit etwas beschleunigen. Doch eines muss klar sein: Während der Athlon eine Menge ungünstiger Maschinencode-Folgen verzeiht, ist der Pentium 4 strikt auf softwareseitige Optimierung an die neue Architektur angewiesen. Andernfalls kann die Pro-MHz-Leistung im Vergleich zum Pentium III bis auf Hälfte sinken. Ist ein Programm für den Pentium III optimiert, bringt das seinem Nachfolger gar nichts.



   Fazit

Die geringe Pro-MHz-Leistung des Pentium 4 ist keineswegs ein Design-Fehler, sondern die Schattenseite einer so gewollten neuen Architektur. Diese ermöglicht deutlich höhere Taktraten und ist zumindest mittelfristig effizienter. Pentium 4 optimierte Programme schliessen nicht nur SSE2-Support ein, sondern auch Rücksichtnahme auf bestimmte Schwachstellen der Pentium 4 Architektur. Der SSE2-Support wird sich nur breit durchsetzen, wenn CPUs mit entsprechendem Support breit verfügbar sind - sprich, wenn AMD-Prozessoren ebenfalls SSE2-Unterstützung aufweisen. Es kann also sein, dass der Pentium 4 in Zukunft durch verstärkte Software-Optimierungen beträchtlich hinzugewinnt.

Die Frage, wie sich der Pentium 4 heute darstellt, ist nicht eindeutig zu beantworten. Bei der Leistungsfrage zählt nicht die Pro-MHz-Leistung, sondern wieviel effektive Arbeit eine CPU zu leisten vermag. Deutliche Vorteile für den vierten Pentium gibt es bislang nur, wenn es um das Konvertieren (also auch Komprimieren) von Medien-Datenströmen geht. Ein weiterer Vorteil ist die Verfügbarkeit von sehr stabilen Intel-Chipsätzen, sowie natürlich die zur Verfügung gestellte Bandbreite - wenn man die richtige Speicherart verwendet. Ob das als Anreiz ausreichend ist, den Mehrpreis im Vergleich zum Athlon aufzubringen, kann nur jeder für sich selbst entscheiden.

Um schneller als AMD zu sein, braucht Intel derzeit lediglich an der Taktschraube zu drehen. Angesichts heutiger Übertaktungs-Erfolge scheint es, als ob noch eine ganze Menge Luft nach oben beim Pentium 4 ist. AMD ist in jedem Fall auf eine neue Architektur angewiesen, um hier mithalten zu können. Das Pentium 4 Design wird ohne weitere Änderungen wohl noch bis 5 GHz zu treiben sein - mindestens. Und wie sich Intel gegen den zukünftigen Hammer-Prozessor von AMD positionieren kann, wird auch entscheidend von den dereinst machbaren Pentium 4 Taktraten abhängen.


Fehler und Irrtümer sind in diesem Artikel natürlich nicht ausgeschlossen. In diesem Fall bitte eine Mail schreiben oder das Forum nutzen.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back 3DCenter-Artikel - Index Home

Shortcuts
nach oben