Zum 3DCenter Forum
Inhalt




Die neuen Features im G70-Chip

26. Juni 2005 / von aths / Seite 3 von 3


   Weiterhin eingeschränktes AF

Anisotrope Filterung (AF) zu realisieren ist aufwändig. Und zwar dermaßen aufwändig, dass es keinen einzigen Grafikchip gibt, der bis zu seinem Maximalgrad quasi-perfekte Filterung bietet. Ausnahme sind einige Grafikkarten, die nur bis zu 2x AF bieten. Bei ATI nahm man die Texturfilterqualität noch nie besonders ernst und rechnet gerade mal so genau, dass man die Kompromisse nicht sofort sieht. Dementsprechend sieht auch ATIs AF-Realisierung aus. Erst mit dem R300 ist bei der Radeon AF auch in Kombination mit dem trilinearen Filter möglich. Einige Winkel erhalten trotz aktiviertem 16x AF jedoch nur 2x AF (durch ungenaue LOD-Berechnungen ist die tatsächliche Qualität sogar noch etwas schlechter).

Bei Nvidia wurde zunächst auf Qualität gesetzt. GeForce3 bietet nur bis zu 8x AF, dieses jedoch bis auf wenige Kompromisse in sehr guter Qualität. Bei der GeForce4 Ti wurde die Leistung von bilinearem AF geschmälert, vermutlich um Transistoren zu sparen, doch die Qualität blieb unangetastet. Leider begann mit der GeForceFX-Serie das Experiment, zulasten der Qualität einige wenige zusätzliche Frames pro Sekunde zu schinden. Nvidia argumentierte gegenüber der Presse sinngemäß, dass ATIs AF-Qualität ja deutlich schlechter als bei der GeForce ist und man bei Reviews einen fairen Vergleich haben möchte. Dabei wurde allerdings nicht auf die Antialiasing-Implementierung eingegangen, die in jener Hardware-Generation ab 4x bei ATI ein erheblich besseres Bild lieferte.

Beim NV40 wurde nun der ATI-Style bezüglich AF imitiert. Vorteil: Es wird jetzt halbwegs gleiche Bildqualität verglichen. Es wird beim NV40 in der HQ-Einstellung jetzt halbwegs gleiche Bildqualität verglichen (wobei die GeForce weiterhin leicht im Vorteil ist). In der Q-Einstellung ist leider eine Unterfilterung aktiv, die dafür sorgt, dass viele Texturen zum Flimmern neigen. Wir können nicht empfehlen, mit Q zu spielen sondern raten zum HQ-Modus. Nachteil: Die AF-Qualität anno 2001 (GeForce3) ist heutzutage nicht mehr drin. Der Autor hat bisher noch keine Beschwerden gehört, dass die Texturqualität einer GeForce3 zu gut sei. Der G70 hat die 6,45-fache Texel-Leistung einer originalen GeForce3 und bietet insgesamt weniger hochwertige Texturen. Dies halten wir für inakzeptabel.

Im Pressematerial zum NV40 wurde das gegenüber NV38 verbesserte Antialiasing beschrieben (wenn auch mit einer falschen Abbildung bezüglich der Subpixelmaske). Dem Reviewer wurde empfohlen, 8x AF gegen 8x AF zu benchen, der neue 16x-Modus als zusätzliches Sahnehäubchen vermarktet. Dass das 16x-AF im NV40 ingesamt weniger Qualität als der alte 8x-Modus bringt, wurde mit keiner Silbe erwähnt. Es drängt sich der Eindruck auf, dass dem User dieser Kompromiss stillschweigend untergejubelt werden sollte.

Wer die Nachteile der "optimierten" anisotropen Filterung, die je nach Z-Winkel den Maximalgrad senkt, nicht sieht, sieht offenbar den Vorteil hoher anisotropen Filterung generell nicht so gut. Sonst würde ihm das Nebeneinander von scharfen und unscharfen Texturen auffallen. 4x AF oder 6x AF (seit GeForce3, ebenfalls im NV40 und demnach wohl im G70 möglich, leider nicht per Treiber wählbar) als Maximalgrad reicht dann auch. Wer hohe AF-Grade braucht, möchte diese dann natürlich im ganzen Bild. Die vielen SM3-Features ersetzen keine hochwertige Filterung der Input-Daten (also Texturen). Außerdem bleibt normales Multitexturing als Grundlage von vielen Engines noch auf Jahre erhalten. Die extreme Leistung des G70 lässt sich also nicht in durchweg hohe Texturqualität umsetzen.

Dem Autor fällt in World of WarCraft der Nachteil durch diese nicht abschaltbare "Optimierung" mehr auf als das MIP-Banding bei bilinearer Filterung. Nvidia hat ansonsten ab dem NV40 endlich eine verbesserte LOD-Berechnung implementiert. Bisherige Karten zeigen eine "AF-Blume" - dies ist ein Zugeständnis an den Hardware-Aufwand, da man so den Einbau von Wurzel-Berechnungen sparen kann. Durch einen interessanten Effekt bei nichtrechtwinklig ausgerichteter Abtastung flimmert es auch nicht. Dennoch wird die aufwändigere Formel, die bei jedem Winkel den gleichen LOD liefert, allgemein als höherwertig angesehen, obwohl die Gesamtschärfe, betrachtet über alle Winkel, sogar sinkt.

Seit NV40 gibt es ein recht kreisähnliches LOD-Muster. Dieses bleibt auch bei 2x AF erhalten. Dabei ist zu sagen, dass sich 2x AF aufgrund bestimmter Optimierungsmöglichkeiten recht einfach implementieren lässt. Es wäre wünschenswert, wenn diese hochwertige LOD-Berechnung auch für 4x-16x AF geboten würde – der Qualitätsgewinn wäre deutlich.

Natürlich kostet das Leistung, bleibt aber deutlich effizienter, als wenn Texturschärfe über Supersampling erzeugt werden soll. Angesichts der immer höheren Geometrieleistung wird auch der Anteil an rechtwinklig ausgerichteten Polygonen abnehmen, womit diese AF-"Optimierung" häufiger zum Zuge kommt – in dem weniger Bildqualität erzeugt wird.

Texturfilterung ist ja nicht ein Nebenfeature, Texturierungsleistung bleibt vorerst das entscheidende Merkmal – weil viel mit Texturen gearbeitet wird. SM3-Performance hin oder her – wir brauchen endlich volle AF-Texturqualität im gesamten Bild und nicht nur bei 90°- und 45°-Winkeln. ATI hat mit dem R300 vorgemacht, wie man unter anderem mit minderwertiger AF-Qualität Benchmarks gewinnt, und Nvidia ist inzwischen auf den Zug mit aufgesprungen. Man fragt sich, wohin das führen soll. Wer lieber die Framerate statt insgesamt sehr gute Texturen haben wollte, kann ja weiterhin zur Radeon greifen – Nvidia hat sich den Vorteil einer sehr guten AF-Qualität verspielt und scheint nicht willens, eine Rückbesinnung auf volle Textur-Qualität vorzunehmen.

302 Millionen Transistoren im G70, aber trotz eingestelltem 16x AF erhalten einige Winkel höchstens 2x AF – dafür haben wir kein Verständnis. Die Auswirkungen guter AF-Qualität kann das kritische Auge sofort sehen, im Gegensatz zu auch im Jahre 2005 nur vereinzelt genutzten SM3-Features. Und SM3-Nutzung macht die Wirkung guter anisotropen Texturfilterung ja nicht zunichte.

Wir haben die AF-Qualität vom "Flimmergrad" her noch nicht genauer untersuchen können. Die 6er Serie scheint mit den Treiber-Standardsettings immer (mehr oder weniger) zu flimmern. Dies in synthetischen Testern zu überprüfen, hat sich als nutzlos erwiesen, da der Treiber offenbar Spiele oder die Tester erkennt und die Filterqualität anpasst. Die gute 16x-AF-Leistung der GeForce 7800 GTX könnte unter anderem darin begründet liegen, dass im Vergleich zur 6er Serie etwas weniger Qualität geboten wird. In den wenigen Tagen vom Erhalt der Karte bis zum Launch blieb kaum einem Reviewer Zeit, die AF-Qualität mit der 6er Serie zu vergleichen, dies werden wir später nachholen. Wie wir später herausfanden, so funktioniert beim G70 auch der HQ-Modus nicht richtig: Viele Texturen flimmern. Dies ist natürlich prinzipiell inakzeptabel.


   Features für Longhorn

Schon bei der Vermarktung der GeForceFX 5200 spielte die kommende neue Windows-Generation eine Rolle. Doch ähnlich wie bei Doom 3, beim GeForce3-Launch von John Carmack in einer ersten Demo vorgestellt, dann von Nvidia als Argument zunächst für die GeForce4 Ti herangezogen, schließlich bei der GeForceFX 5800 ausgeschlachtet, um bei der GeForceFX 5900 erneut aufgeführt zu werden: Das Spiel kam erst mit dem Erscheinen des NV40. Wenn man speziell für Longhorn eine Grafikkarte braucht, sollte man sich die Hardware dann kaufen, wenn die Software da ist. Das wird nach derzeitigem Stand der Dinge wohl etwa Ende 2006 der Fall sein.

Nichts desto trotz unterstützt G70 das mit Longhorn kommende Hardware Fontaliasing. Soweit wir wissen, bietet Matrox mit ihrem Parhelia-Chip etwas vergleichbares bereits für aktuelle Windows-Versionen. Das G70-Fontdownsampling kann ohne Leistungsverlust für eine Gamma-Charakteristik von 2,2 erfolgen, andere Gamma-Werte wären per Pixelshader auch realisierbar.


   Erstes Fazit

Bei unzähligen Details merkt man Nvidias Bestreben, Leistung und Qualität zu liefern. Dazu riskierten sie auch Naserümpfen, so zum Beispiel bei der GeForceFX-5800-Ultra-Kühllösung. Das Kühlprinzip wurde später (in einer leiseren Version) von ATI übernommen. Auch SLI – nur wenige können sich dies leisten – wurde von ATI imitiert. Beim FP16-Format unterstützt NV Denorms. Das heißt, dass in Bereichen nahe der Null noch nicht auf Null abgeschnitten werden muss, sondern (mit verringerter Genauigkeit) weiterhin ein Zahlenwert gespeichert werden kann. Denorm-Support wird von DirectX nicht gefordert, Nvidia bietet hier mehr als die Spezifikation verlangt. Dafür waren (seit NV30, übrigens) die Transistoren da, das begrüßen wir.

Ebenso finden wir die Fortschritte bei der Implementierung vom Shader Model 3 im G70 gut. Wir hoffen, dass es vom G70 auch kleinere Versionen geben wird, damit die Effizienz-Vorteile auch alljenen zugänglich werden, die nicht so viel Geld ausgeben können. Wenn sich die Version mit 24/8 Pipes auf 430 MHz takten lässt, sind bei 16/6 Pipes vielleicht schon knapp 500 MHz drin, bei einer 8/3-Version (oder auch 8/4-Version) könnten die 500 MHz deutlich überschritten werden.

Das neue Antialiasing lässt sich in bestehenden Spielen sofort nutzen, Nvidia verbaute hier extra Schaltkreise, um die vorhandene Leistung effizient in Bildqualität umzusetzen. Es gibt keinen Zwang mehr, beim Supersampling zu einer ineffizenten Abtastmaske zu greifen und das gesamte Bild mit Supersampling berechnen zu müssen. Nur die Polygone, die es brauchen, bekommen Supersampling und zwar mit der bestmöglichen Subpixel-Anordnung.

Das ist schlichtweg genial zu nennen. Umso stärker steht die AF-Implementierung im Kontrast. Nvidia hat die Chance verpasst, im Angesichte der mit dem NV40 verbesserten isotropen Filterung und dem 2x-AF-Modus diesen Qualitätsvorteil auch höheren AF-Graden zukommen zu lassen. Klar kostet das Texturleistung, doch die ist ja in rauen Mengen vorhanden. Und was man an Leistung einbüßt, hätte man direkt in Texturqualität zu sehen bekommen. Mehr noch, es wäre der effizienteste Weg zu bester Texturqualität, also der Weg, der am wenigsten Leistung pro Zusatzqualität kostet.

Unter dem Strich bleibt ein technisch exzellenter Chip mit interessanten neuen Features, die zur Steigerung der Bildqualität beitragen können. Dass der anisotrope Texturfilter nicht für volle Qualität ausgelegt wurde, sehen wir als krassen Nachteil – der größte Teil des Bildes besteht ja aus gefilterten Texturen. Bei aktivertem 16x AF stellenweise nur 2x AF zu bekommen, wurde in der Euphorie um ATIs R300 viel zu wenig beachtet. Das kann aber kein Grund sein, den zur Zeit schnellsten SM3-Chip mit einem gegenüber dem R300 nur geringfügig besserem 16x AF auszustatten.


Wir danken allen, die an der Entstehung dieses Artikels direkt oder indirekt beteiligt waren, insbesondere Nvidia für die schnelle Reaktion auf unsere Fragen. Weiterhin danken wir Xmas für bestimmte Hintergrundinformationen, sowie dem 3DCenter-Forum, insbesondere alljenen aus diesem Thread. Außerdem danken wir Mr. Lolman für vergleichendes Bildmaterial zum Q- und HQ-Modus des NV40 und Anonym_001 für den Hinweis, dass beim Treiberstandard keine Vergleichbarkeit zum AF der Radeons gegeben ist.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back 3DCenter-Artikel - Index Home

Shortcuts
nach oben