Zum 3DCenter Forum
Inhalt




Interview mit NVIDIAs Andrew Humber

5. März 2003 / von aths / Seite 1 von 1


   10 Fragen an nVidia, die neue GeForceFX betreffend

Unser Interview-Partner ist Andrew Humber, European PR Manager von NVIDIA (ich glaube nicht, dass NVIDIA noch vorgestellt werden muss).


1) Sie fingen bei STB an, kamen dann zu 3dfx und arbeiten nun für NVIDIA. Können Sie uns erzählen, ob und welche 3dfx-Technologie es in die neue GeForceFX-GPU geschafft hat?

NVIDIA: Die GeForceFX ist eine Kombination von Technologie, die sowohl von NVIDIA als auch von 3dfx entwickelt wurde. Als NVIDIA den Nachlass der 3dfx-Technologie erwarb, wurden über 100 3dfx-Ingenieuren Stellen bei NVIDIA angeboten, und diese Ingenieure wurden sofort quer über alle in der Entwicklung befindlichen Produkte eingesetzt. Das Team, das aus der gemischten Gruppe gebildet wurde, nahm die besten Elemente von beiden Architekturen und erschuf die GeForceFX.


2) Da Anti-Aliasing für unsere Leser immer wichtiger wird, haben wir die 6xS und 8x Modi untersucht, welche die neuen Treiber anbieten. Wir haben dafür auch unsere Vermutungen veröffentlich, wie die Subpixelmasken aussehen könnten (http://www.3dcenter.org/artikel/2002/11-20_b.php). Können Sie bestätigen, ob unsere Vermutungen richtig sind? Wird beim 4x-Multisampling-Modus ein Ordered Grid oder ein Rotated Grid verwendet?

NVIDIA: Der 4xS-Modus der GeForceFX verwendet ein Rotated Grid Muster. Der 4x-Standard-Modus verwendet ein Ordered Grid Muster.


3) Nach der Einführung von Multisampling Anti-Aliasing, welches schnelle Kantenglättung auch bei hohen Auflösungen ermöglicht, scheint NVIDIA wieder mehr Supersampling in seine Modi zu bringen. Was sind die Gründe dafür, dass NVIDIA diese "neuen alten" Strategien verfolgt?

NVIDIA: NVIDIA bietet viele verschiedene Anti-Aliasing Modi an, um dem Spieler mehr Auswahl zu bieten. Mit dem Hinzufügen der "hybriden" Modi, die sowohl Supersampling als auch Multisampling verwenden, können wir mehr Modi anbieten als sonst. Mehr Auswahl ist gut für den Spieler, weil er oder sie auswählen kann, wie das Spiel gespielt werden soll und Leistung gegen Qualität eingetauscht wird. Für einige ältere Spiele, die eine feste Auflösung haben, oder für jedes CPU-limitierte Spiel kann der Spieler die Modi mit höherer Qualität verwenden, wie 6xS oder 8xS, und trotzdem hohe Frameraten genießen. Für neuere Spiele, die durch die GPU oder den verfügbare Grafikkarten-Speicher limitiert sind, glauben wir, dass Spieler gerne die AA-Einstellung Quincunx oder 2x verwenden.


4) Wir sind neugierig: Warum entschied NVIDIA, die Effizienz der 128 Bit Speicher-Schnittstelle zu erhöhen, anstatt die physikalische Größe zu verbreitern? Können wir 2003 ein 256-Bit-Interface erwarten?

NVIDIA: Die Speicherbandbreite ist nur ein Teil der Performance-Bilanz. Siehe beispielsweise Matrox und ihr 256-Bit Speicher-Interface. Wie die Speicherbandbreite genutzt wird ist wichtiger. Leistung erschließt sich nicht nur aus der rohen Speicherbandbreite. Die Auslastung der verfügbaren Bandbreite wurde bei uns radikal gesteigert, was zu höherer Leistung führt. Mit Color-Compression, Z-Compression und der Crossbar Memory Architecture nutzen wir unsere vorhandene Bandbreite besser aus. Wir haben ebenso andere Faktoren anzubieten wie DDR-2, neue Vertex Shader, neue Pixel Shader und den 0.13 micron Herstellungsprozess, was sich in höherer Leistung widerspiegelt. Unter dem Strich sind theoretische Zahlen nett zu diskutieren, aber was wirklich zählt ist die Praxis-Leistung.


5) Eines der neuen GeForceFX Merkmale ist etwas, dass NVIDIA "Adaptive Texture Filtering" nennt. Wir haben gelesen, dass der Chip den Sample-Modus auf Pixel-Basis einstellt. Aber der beeindruckendste Teil scheint zu sein, dass der Chip automatisch den Textur-Inhalt überwacht, um zu entscheiden, welcher Sample-Modus genutzt wird. Können Sie uns bitte mehr über dieses Feature erzählen?

NVIDIA: Die GeForceFX-Familie hat einen speziellen adaptiven Textur-Filter-Modus, welchen der Endkunde mit einem Slider im Control Panel ein- oder ausschalten kann. Die konservative Einstellung wird die übliche Textur-Filterung ausführen. Wenn der Slider zur aggressiven Seite geschoben wird, aktiviert das einen adaptiven Texturfilter-Algorithmus, der höhere Leistung bringen kann, indem die Textur-Daten analysiert und intelligente Kompromisse geschlossen werden, um die Leistung zu erhöhen, während eine hohe Bildqualität erhalten bleibt.


6) Die GeForceFX lässt sehr lange Pixel Shader Programme zu. Das ist sicher ein schönes Feature, aber ziemliche viele Leute halten in Anbetracht dessen, dass solche langen Programme wahrscheinlich niemals mit guter Leistung in Echtzeit laufen, dies für eine Verschwendung von Ressourcen. Ist es möglich, uns einige Leistungs-Zahlen zu geben, zum Beispiel wie viele Pixel Shader Operationen die GeForceFX pro Sekunde verarbeiten kann?

NVIDIA: Je mehr Instruktionen man hat, je mehr Realität kann der Entwickler ins Spiel packen - letztendlich wird der Entwickler oder Künstler die optimale Anzahl an Befehlen ansetzen, um die beste Mischung aus Leistung und Bildqualität/Realismus zu bekommen. Das wird immer ein Kompromiss sein, aber wir arbeiten intensiv, um dem Entwickler diese Möglichkeiten zu geben, um sicherzustellen, dass die Welle der Next-Generation-Spiele so gut aussieht wie irgend möglich.


7) Wie erwartet, unterstützt die GeForceFX weiterhin alle OpenGL-Extension ihrer Vorgänger. Außerdem können Register Comber (Combiner) zusammen mit den neuen Fragment Programs zusammenarbeiten. Weil diese beiden Methoden mit Subpixel-Verarbeitung nicht viel gemein haben, wüssten wir gerne, ob die Register Combiner im Pixel Shader emuliert werden oder die GeForceFX dafür zusätzliche Hardware hat.

NVIDIA: Ich fürchte, das ist geheim.

8) In naher Zukunft werden wir Doom III und eine Anzahl anderer Spiele basierend auf der neuen id Engine sehen. Wir wissen bereits, dass Doom III den Stencil Buffer sehr stark beanspruchen wird. Bietet die GeForceFX hier Features an, um die Leistung zu steigern, wie möglicherweise "Fast Stencil Clear", "Early Stencil Test" oder einen "Hierarchical Stencil Buffer"?

NVIDIA: Die GeForceFX ist sehr schnell bei Stencil Operationen, aber wir vermarkten keine Stencil-spezifischen Implementierung.


9) Für die GeForceFX hat NVIDIA eine neuartige Color-Compression Technologie entwickelt, die Farbwerte bis zu 4-fach komprimieren kann. Wird Color Compression immer genutzt oder nur mit aktiviertem Anti-Aliasing? Wenn es sogar ohne Anti-Aliasing genutzt wird, heißt das, dass die Color Compression auch auf Texturen angewendet wird, die beispielsweiste mit DXT1 bereits komprimiert wurden? Genauer gefragt, werden Texturen, welche mit Render-to-Texture erzeugt wurden, ebenfalls mit der Color Compression komprimiert?

NVIDIA: Die GeForceFX Farben-Komprimierung ist nur mit Anti-Aliasing aktiv und wird nur auf den Framebuffer angewendet. Die GeForceFX verwendet für Texturkomprimierung DXTC und S3TC.


10) Wird NVIDIA die TCPA-Technologie in zukünftigen Treibern und Hardware unterstützen?

NVIDIA: NVIDIA wird bei TCPA-bezogenen Technologien und Produkten führend sein.



Wir möchten nun nachfolgend unsere Schlussfolgerungen aus den Antworten von NVIDIA ziehen.

1) NVIDIA sagt, dass die besten Technologien beider Welten (3dfx und nVidia) in der GeForceFX verschmolzen seien. Leider scheint das Anti-Aliasing davon nur indirekt betroffen zu sein. Dieses wurde ja schon für die GeForce4 gegenüber der GeForce3 leicht verbessert (was sowohl Bild-Qualität als auch Leistung betrifft). Darüber hinausgehende FSAA-Verbesserungen hat die GeForceFX nicht aufzuweisen. In Dingen Pixel Shader scheinen jedoch so einige 3dfx-Ideen eingeflossen zu sein, was die Flexibilität betrifft. Zudem ist GeForceFX voll zu den bewährten NVIDIA Register Combinern kompatibel. Da sich 3dfx in ihrer letzten Ära als FSAA-Spezialist einen Namen machte ist es trotzdem enttäuschend, keine über die GeForce4 hinaus gehende FSAA-Qualität geboten zu bekommen. ATi bietet derzeit mit dem R300 eine klar bessere FSAA-Lösung an.

2) Leider wurde auf den ersten Teil unserer Frage keine Antwort gegeben. Wir fragten deshalb übrigens noch einmal nach, doch erhielten bis heute keine Reaktion. Die Konfusion besteht nämlich darin, dass in den neueren Detonatoren jeweils gleich zwei 6x bzw. 8x-Anti-Aliasing-Modi angeboten werden. Seltsamerweise nutzt die GeForceFX mit derzeitigen Treibern die qualitätiv schlechteren Verfahren, welche in der Praxis nicht einmal 4xS-Qualität erreichen. Vielleicht wird NVIDIA ja eines Tages Klarheit schaffen, warum sie das so entschieden haben. 4xS "verwendet" übrigens tatsächlich ein (gutes) Rotated Grid Muster, ist insgesamt aber nur ein (nicht ganz so gutes) so genanntes "skewed grid", da es sowohl aus Rotated als auch (schlechtem) Ordered Grid FSAA besteht.

3) Umfrage zufolge wird Quincunx praktisch gar nicht, 2x FSAA jedoch sehr häufig verwendet. Es ist natürlich richtig, dass bei CPU-Limitierung ein höherer FSAA-Modus so ziemlich das beste ist, was man einstellen kann. Jedoch ist es angesichts der Performance und der Qualität der 4x und 6x-Modi einer Radeon 9700 sehr schade, dass NVIDIA für leistungsbewusste Anwender nur 2x FSAA anbieten kann. Diesem Manko wird nicht dadurch abgeholfen, dass auch höherstufige FSAA-Modi eingestellt werden können, da der Kompromiss von "Leistungs pro Qualität" ab 4x bei GeForce 3/4/FX sehr ungünstig wird.

4) NVIDIA zeigt auf das ineffiziente Parhelia-Interface und erwähnt wohlwissentlich nicht das gut optimierte R300-Interface. Es ist völlig richtig, dass theoretisch vorhandene Bandbreite wenig zählt (was übrigens im Nachhinein die Methode von GeForce2 Pro und Ultra konterkariert, die in erster Line einen extrem schnellen Speicher haben, aber die Karten mit der am ineffizientesten genutzten Speicherbandbreite sind) und es auf die RealWorld-Performance ankommt. Hier zeigt sich allerdings, dass in speicherbandbreite-intensiven Szenarien (Multisampling Anti-Aliasing) die Radeon 9700 Pro eine GeForceFX schlägt. Die neuen LMA3-Features können offensichtlich den Nachteil an Roh-Bandbreite nicht ausgleichen. Was Pixel- und Vertex Shader, sowie der 0.13 micron Herstellungsprozess mit der Speicherbandbreite zu tun haben könnten, sind wir zu erraten nicht imstande.

5) Ob Intellisample tatsächlich den Textur-Inhalt analysiert, ist nach unserem Wissens noch nicht nachgewiesen worden. Möglich wäre das, möglich wäre ebenso eine andere Optimierung: Der AF-Sampler wechselt erst später auf das nächsthöhere anisotrope Filterlevel, als es die Optimalitäts-Kriterien erfordern. Wir können aber auch den Sinn einer "intelligenten" Methode ehrlich gesagt nicht so recht nachvollziehen. Ist beispielsweise 8x AF zu langsam, bleibt die Möglichkeit zu 4x oder 2x AF. Warum es sinnvoller sein soll, "optimiertes" 8x zu verwenden, konnten wir bislang nicht ermitteln. Genaue Analysen des Intellisample-Features stehen von unserer Seite wie gesagt noch aus, an diesem Punkt könnten wir mangels unabhängiger Fakten nur Vermutungen präsentieren, was wir uns ersparen wollen.

6) Leider blieb NVIDIA uns die Antwort auf die konkrete Frage, wieviele Pixel Shader Operationen die GeForceFX pro Sekunde verarbeiten kann, schuldig. Ansonsten wird gesagt, dass die großzügigen Shader-Dimensionen den Entwicklern schon heute erlaubt, für morgen zu programmieren. Das ist natürlich eine sinnvolle Sache: Je eher die besseren Shader hardwareseitig unterstützt werden, desto eher werden Entwickler die erweiterten Möglichkeiten auch nutzen.

7) Schade, dass NVIDIA nicht bereit war zu klären, ob die "alten" Shader mit den neuen emuliert werden oder es für sie extra Schaltkreise gibt.

8) Stencil-Buffer sind sozusagen zweckentfremdete Bits aus dem Z-Buffer. Ihn unabhängiger vom Z-Buffer zu machen, würde hardwaremäßig einigen Aufwand bedeuten, könnte aber bestimmte Nex-Gen-Engines beschleunigen. Offenbar setzt aber weder NVIDIA noch ATI hier Prioritäten. Zum Glück wird das aber auch nicht sträflich vernachlässigt - obwohl die GeForceFX beim "normalen" Rendering mit Texturen wie eine 4x2-Architektur wirkt, arbeitet der Chip bei reinem Z- bzw. Stencil-Rendering als 8x1-Architektur.

9) Color Compression funktioniert laut NVIDIA nur im Zusammenspiel mit Anti-Aliasing, was eine Korrespondenz zur R300 darstellt. Die Antwort enthält eine weitere Information, und zwar dass weder FXT1, noch (bislang nicht in Hardware verfügbare) FXT2 Textur-Komprimierung unterstützt wird. Der von 3dfx für den VSA-100 entwickelte lizenzfreie FXT1-Standard wäre jedenfalls mit Sicherheit frei vom GeForce-DXT1-"Bug".

10) "NVIDIA wird ein Führer bei TCPA-bezogener Technologie und Produkten sein" spricht für sich. Wir vom 3DCenter sehen die TCPA-Entwicklung mit großer Sorge.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig 3DCenter-Artikel - Index Home

Shortcuts
nach oben