Zum 3DCenter Forum
Inhalt




Inside ATIs R420

4. Mai 2004 / von aths / Seite 3 von 4


   Die Pipeline

Unser Bild von der Pipe gilt für R300, R360 und R420. Da es schwierig ist, unterschiedliche Architekturen (NV vs. ATI) zu vergleichen, mussten wir einige Vereinfachungen vornehmen. Die Tabellen enthalten weitere Details, noch konkreter werden wir im Fließtext. Zunächst ein Blick auf das Diagramm:



Links die Pipe R420, rechts NV40, in jeweils vereinfachter Form.


Auf den ersten Blick sieht die NV40-pipe deutlich größer (und daher "besser") aus, doch das Bild zeigt nicht die ganze Wahrheit. Stellen wir die Details gegenüber:


  R300/R350/R360/R420 NV40
Texture-Ops per Pipe 1 1
Separate Tex-Unit Ja Nein
Splitmöglichkeiten 4:0, 3:1 4:0, 3:1, 2:2
Allzweck-FPU? Ja Nein
Anzahl FPUs 1 2

R420 hat seine separate Logik für Textur-Operationen, währenddessen eine Texture-Operationen zumindest teilweise die erste Shader Unit der NV40-Pipe blockiert. NV40 gleicht das allerdings sehr erfolgreich mit einer zusätzlichen FPU aus. ("FPU" und "Shader Unit" verwenden wir in diesem Artikel synonym.)

Da NV40 auch zwei Vector2-Instruktionen bündeln kann (und nicht nur Vector3 + Skalar) scheint es als dass die NV40-Pipe effizienter arbeiten müsste. Man sollte aber im Hinterkopf behalten, dass jede Shader Unit auf ihre eigenen, speziellen Operationen beschränkt ist. (Als Ausnahme zählt die Multiplikation, das können beide Units erledigen.) R420 auf der anderen Seite nutzt eine Allzweck-Shader Unit, die alles berechnen kann. Die Unit vom R420 wird dabei eigentlich nicht gesplittet, sondern besteht aus zwei unabhängingen Einheuten (einmal Vektor3, einmal Skalar) die kombiniert werden können (zu Vektor4.) Damit steigt die Chance gegenüber einer auf spezielle Instruktionen limiterte FPU, die Auslastung zu erhöhen. Weitere Details heben wir uns für einen zukünftigen Artikel auf.

So gesehen ist die Radeon-Pipe sehr effizient, während Nvidia eher eine Brute-Force-Lösung hat. GeForce FX und die neue 6-er Serie bieten allerdings schnellere Berechnung für bestimmte Spezial-Funktionen verglichen mit ATIs Hardware. Tatsächlich ist es besser, zwei eingeschränkte (also keine Allwzeck-) Shader-FPUs wie die im NV40 zu haben, als eine flexiblere aber einzelne FPU. Bei einem durchschnittlichen "Real World"-Shader mit langen arithmetischen Berechnungen sollte NV40 schneller sein – wenn man Takt für Takt vergleich. ATI muss mit höherem Takt dagegenhalten, und das tun sie auch. Wenn sich uns die Gelegenheit bietet, werden wir versuchen sehr lange Shader laufen zu lassen um die tatsächlice Rechengeschwindigkeit beider Architekturen vergleichen zu können. Da es so aussieht dass der Shader Compiler für den NV40 noch immer nicht ausoptimiert wurde, müssen wir für einen fairen Vergleich ohnehin noch etwas warten.

Betrachten wir einige weitere Details:


  R300/R350/R360/R420 NV40
TMUs per Pipe 1 1
Extra Skalierungs-Logik für die TMU Nein Ja
Mini-FPUs für Arithmetik Ja Ja (beide Shader Units.)

Die NV40-Pipe ist offensichtlich so gebaut, dass sie pro Takt so viel wie möglich tun kann (wobei inkauf genommen wird, dass vielleicht einige Units nicht ausgelastet werden können), wohingegen die R420- (und natürlich ebenso die R300-) Pipe unter dem Gesichtspunkt entworfen ist, "Leer-Takte" zu vermeiden wo immer möglich. Anhand dieser Fakten kann jeder selbst entscheiden, was er bevorzugt.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back Weiter / Next

Shortcuts
nach oben