GeForce4 Ti: Pro und Kontra
11. Februar 2002 / von aths / Seite 2 von 3
Zum 3D-Teil: Die GeForce4 Ti unterstützt nun PixelShader 1.3 voll in Hardware. Damit kann sie gegenüber ihrem Vorgänger einige Befehle mehr ausführen. Der erweiterte Befehlssatz kann besser mit dem Z-Wert umgehen und erlaubt beim Bump Mapping besondere Spezialitäten - so daß ist jetzt eine Qualität möglich, wie sie noch auf keiner GeForce zu sehen war.
Für die wichtigen Skalarprodukte gibt es zusätzliche Befehle, vor allem um Texturen als Look-Up-Datentabelle zu verwenden. Des weiteren wird ein Skalarprodukt mit vier (und nicht nur drei) Komponenten ermöglicht. Das kann z.B. für bestimmte Nebel-Effekte genutzt werden, nämlich wenn der Abstand zum Betrachter eine Rolle spielt. Obwohl der PixelShader 1.3 einfacher aufgebaut ist, als der mit zwei Phasen arbeitende PixelShader 1.4, ergibt sich auch hier eine gewisse Konfusion: Das neue Skalarprodukt zählt wie zwei Befehle. Das muss der Programmierer wissen, da das von DirectX aktuell nicht erkannt wird.
Eine weitere Neuerung ist ein Befehl zum Vergleichen - damit sind in Ansätzen bedingte Verzweigungen möglich - ein nicht zu unterschätzender Fortschritt! Auch dieser Befehl zählt wie zwei, was ebenfalls im aktuellen DirectX nicht erkannt wird. Um die Vorteile des verbesserten PixelShaders zusammenzufassen: Dank neuer Befehle sind zum Beispiel besseres Bump Mapping und vor allem bessere prozedurale (vereinfacht gesagt: programmierbare) Texturen möglich. Der Software-Support von PixelShadern steht allerdings noch etwas in den Sternen.
Was man mit einer GeForce4 Ti dagegen schon heute nutzen kann, ist das verbesserte Anti-Aliasing. Nun, Quincunx ist jetzt nicht mehr langsamer als 2x - aber einen unscharfen Monitor anzuschließen, wäre ja ebenfalls ohne Geschwindigkeitsverlust machbar :-). Der 4x-Modus leidet nach wie vor darunter, dass die Qualität kaum besser als mit 2x ist.
Durch den neuen 4xS-Modus hat sich das geändert: Er ist nur wenig langsamer als der normale 4x Modus, bringt jedoch gleichzeitig bessere horizontale Kantenglättung - und schärfere Texturen. In Y-Richtung wird nämlich zusätzlich quasi anisotrop gefiltert. Für die meisten praktischen Szenarien bringt das einen spürbareren optischen Vorteil, die Qualität ist sichtlich besser als mit reinem Multisampling. Das betrifft in erster Linie Boden-Texturen.
Ebenso wurde der Texturkompression endlich um einen ärgerlichen Bug erleichtert. Natürlich bringt Kompression noch etwas Qualitätsverlust, doch nicht mehr so drastisch, wie der DXT1-Modus das brachte (nur auf GeForce 1-3).
Kontra
Am GeForce4 Ti gibt es jedoch auch einiges zu bemängeln. Das Anti-Aliasing liefert in der 4x-Einstellung kaum glättere Kanten als mit 2x - dafür aber einen gehörigen Performance-Drop, der in einer Größenordnung von 50% liegt! Ein gedrehtes Raster wie von der Voodoo5 verwendet, würde bei der 4x-Einstellung einen deutlichen Mehrnutzen gegenüber 2x bringen. Dazu wären einige Änderungen am Chip notwendig, was sich nVidia offensichtlich sparte.
Die 4xS-Einstellung, inoffiziell bereits bei der GeForce3 angeboten, bringt hier bessere Ergebnisse, kommt aber an die von der Voodoo5 bekannte Qualität der Kantenglättung eindeutig nicht heran. Das finden wir für einen HighEnd-Chip wirklich enttäuschend. Außerdem kann der 4xS-Modus den Vorteil des geringen zusätzlichen Leistungs-Verlustes nicht zusammen mit dem anisotropen Filter ausspielen.
Das ist der zweite große Kritikpunkt: Mit 4x anisotropen Filter muss man über den Daumen gepeilt bereits auf 40% der Leistung verzichten. Nun, AF auf der GeForce ist dem AF der Radeon qualitätsmäßig überlegen und zeigt auch bei 45°-Winkeln keinerlei Schwächen. Der Leistungsverlust schlägt aber ziemlich übel rein, so dass man AF und AA zusammen nur in jeweils recht gemäßigten Einstellungen fahren kann - für einen HighEnd-Chip reichlich dürftig. Die Radeon 8500 bringt 16x AF und 2x FSAA (entspricht dann sogar quasi 32x AF) mit einem vergleichbaren Speed, wenn GeForce4 Ti nur 4x AF und ebenfalls 2x AA nutzt. Und die Radeon 8500 ist doch um einige preiswerter als die GeForce4 Ti!
Unter Umständen könnten neue Treiber bei AF- bzw. 4x AA-Leistung etwas bewirken. Nach meiner groben Schätzung sind 10% mehr Geschwindigkeit (vom Rohspeed gerechnet) durchaus noch machbar. Wer mit bilinearem (mehr bietet die Radeon ja auch nicht) 4x AF leben kann, fährt perfomancemäßig immerhin vertretbar.
nVidia hat hier auf die ATi-Strategie reagiert und vermarktet unter AccuView nun AA und AF zusammen. Das ist clever - so wollen sie sich vom Vorwurf lösen, unscharfe Texturen zu liefern. Sie hätten sich lieber von Quincunx lösen sollen.
Auch ansonsten ist klar zu sehen, dass ATi Vorreiter ist und nVidia lediglich hinterher hechelt: 2D-Features, die bei ATi seit Jahren Standard sind, finden bei nVidia erst jetzt Einzug. Gut - besser spät als nie. Doch indem nVidia dem PixelShader 1.4 ihren Hardware-Support verweigern, treten sie auf die Innovationsbremse. Mit ihrer Marktmacht verhindern sie, dass der fortschrittlichere PixelShader 1.4 in näherer Zukunft breiter genutzt werden wird. Eine Radeon8500 kann sechs Texturen pro Pass verarbeiten, eine GeForce4 Ti leider nur vier. nVidia passt ihre Hardware also nur dort an, wo es unbedingt sein muss - und ignoriert den Fortschritt dort, wo er sich noch nicht offensichtlich äußert.
Noch dazu verzögern sie den Start der definitiv lohnenswertesten GeForce4 Ti - der Ti4200 - um zwischenzeitlich ihre überteuerte MX460 an den Mann und die Frau bringen zu können. Im HighEnd-Segment liefern sie nur DirectX 8.0 (GeForce 3/4), während ATi für den Massenmarkt bereits DirectX 8.1 Hardware ausliefert (Radeon 8500) - und nVidia hier nur DirectX7-Karten vorweisen kann (GeForce4 MX).
Es ist im exzellent wirrem AccuView-PDF bei 4xS die Rede von "50 percent more subpixel coverage than previous modes". Was soll dies nun bedeuten? Während 4x im ordered grid Verfahren pro Achse (X und Y) 2x sampelt, wird hier nun auf der Y-Achse 4x gesampelt. Das macht sechs gegenüber vier Achsen-Samplepositionen pro Pixel. Nicht schlecht, doch rotated grid schafft acht Achsen-Samplepositionen bei ebenfalls nur vier Subpixeln. Der Fortschritt blieb auf halber Strecke, wird aber mit einer Blend-Packung versehen. ATi bietet im Treiber bereits 10 Anti-Aliasing-Einstellungen an, nVidia nur 4.
nVidia hat die Geschwindigkeits-Vorteil von Accuview gezeigt - indem die alte und neue Technologie mit unterschiedlichen Taktraten verwendet wurde. Von dieser "Qualität" des PDFs (u. a. unterschiedliche Auflösung verwenden, um die schärferen Texturen beim 4xS-Verfahren zu demonstrieren) ist das ganze Marketing um die Einführung. Nicht vorhandener Fortschritt wird mit lautem Getrommel und sich überschlagenden Selbstbeweihräucherungen übertönt. Bislang ist die Mehr-Geschwindigkeit der GeForce4 Ti (vom Anti-Aliasing abgesehen) fast nur dem höheren Takt zuzurechnen, wird aber der "neuen" Architektur zugeschustert. Dessen Vorteile wird der Kunde wohl erst per Treiber nachgeliefert bekommen, wenn es wieder einmal eine ATi-Karte zu kontern gilt.