Inside ATIs R420
4. Mai 2004 / von aths / Seite 4 von 4
Rohe Gewalt gegen Leistungsmerkmale?
Wie bereits gesagt, ist auf den R420 (genau wie beim R300) noch immer einfacher zu optimieren als für eine beliebige GeForce, dazu gehört auch die 6-er Serie. Das ist ein Trumpf von ATI. Aber effektive Rohleistung ist nicht alles. Wenn auch für den NV40 schwieriger zu optimieren ist, kann die GPU eine Menge ausführen was der R420 nach wie vor "emulieren" muss. Man nehme so genannte HDR als Beispiel (was für uns eigentlich Medium Dynamic Rendering ist, MDR.) R420 muss mindestens vier FP-Textursamples abrufen und im Pixelshader filtern, und das Ergebnis auf eine FP-Textur rendern. NV40 hat eingebaute FP-Filterung bishin zu 16x AF (direkt in der TMU, was den Pixelshader entlastet) und kann in einen FP-Framebuffer rendern (wodurch kein Multisampling AA mehr möglich ist.)
Das "Backend" bei MDR/HDR, Tone Mapping, kann die NV40-RAMDAC-Logik übernehmen, wohingegen R420 wieder den Pixelshader bemühen muss. NV40 bietet teilweisen OpenEXR-support direkt im Chip. Echte Kino-Effekte sind auf solche Technologien angewiesen (wie immer man sie bezeichnet.) Wenn der R420 solche Effekte zwar auch rendern kann, wurde er doch nicht wirklich dafür designt. Insofern halten wir den R420 für einen Zwischenschritt.
Weil das Featureset für heutige Spiele (wie Far Cry) gut genug ist, genau wie für die morgigen (beispielsweise Halflife 2) ist der R420 natürlich trotzdem ein interessantes Produkt.
Technisches Fazit
ATI bringt das, worauf Spieler scharf sind. Wenn sich auch 3Dc (offensichtlich ein modifiziertes DXT5) ziemlich ärmlich macht verglichen mit der Konkurrenz, die da Gleitkomma-TMUs, FP-Framebuffer, RAMDAC mit Tone Mapping-Unterstützung, komplette Shader 3.0-Unterstütztung mit Texturzugriff aus dem Vertexshader usw. anbietet, kann die Komprimierung von Normal Maps sofort vom Entwickler eingesetzt werden und womöglich die Leistung in Spielen, die stark auf Bumpmapping setzen, beschleunigen.
Einsichtigerweise ist ATI stolz darauf, die Performance des bisherigen Leistungskönigs, ihrer eigenen 9800 XT, beinahe verdoppelt zu haben. Das ist ja auch eine starke Leistung. Zwar kommt R420 mit nur 160 Millionen Transistoren (etwa 30% weniger als eine andere, kürzlich vorgestellte GPU) aber sie enthält alles was man braucht, um Spiele mit guter Qualität bei höchstmöglichen Frameraten zu spielen.
Persönliches Fazit des Autors
Betrachtet man Features und Performance, war der R100 erstaunlich, R200 noch besser, und R300 brachte endlich die Wende. Mit sehr wenigen Verbesserungen in diesem Chip (dem R360) schaffte ATI es, Nvidia wieder und wieder zu blamieren. Auch NV38, eine hoch getaktete Version des NV35, welcher ein ziemlicher Fortschritt zum NV30 darstellt, konnte mit einer 9800 XT nicht wirklich mithalten. Jetzt bringt Nvidia eine komplett neue Architektur mit massiven Performance-Verbesserungen, und sie sind drauf und dran, den Kampf erneut zu verlieren, wenn auch mit kleinerem Abstand.
Aber, Geschwindigkeit darf nicht der einzige Maßstab sein. Jede beliebige FX 5200 mit einem 64-Bit-Speicherinterface, zu kriegen für etwa 70 €, bietet sehr viel mehr Shaderfeatures an, als die X800 XT. Zwar ist die 5200 extrem langsam, und doch etwa 100 mal schneller als Software-Rendering, wohingegen die X800 nur vergleichsweise simple Shader rendern kann. Ich will das Thema hier nicht vertiefen und auch nicht ausführen ob man die NV40-Features braucht. Tatsache ist: Nvidia liefert sowohl Geschwindigkeit als auch Features, während ATI nur Geschwindigkeit bietet. Wenn die X800 auch schneller sein mag als Nvidias neuestes Werk, ist sie damit nicht automatisch die bessere Karte. Andererseits, da wir jetzt wohl keine greifbaren Vorteile vom SM 3.0 oder anderen NV40-Merkmalen haben, ist das featuremäßig "vollständigere" Produkt genauso wenig automatisch die besseren Wahl.
Es ist schön zu sehen, dass die beiden führenden GPU-Entwickler unterschiedliche Ziele verfolgen. Somit können wir unterschiedliche Technik-Ansätze nicht nur diskutieren, sondern live erfahren.
Wie bewertet man nun eine GPU? Für mich gilt: Leistung ist gut, und Features sind nett wenn man sie hat, doch ich bin zufrieden wenn die Performance "reicht" und die Features "brauchbar" sind; und gucke auf Bildqualität. R420 bietet ziemlich alte, aber nach wie vor beste erhälte Antialiasing-Technologie. Da ich gegenüber Aliasing-Artefakten sehr empfindlich bin, stellt mich das 6x sparsed Edge-AA weiterhin voll zufrieden.
Außerdem achte ich auf Texturqualität. Verwöhnt mit dem exzellenten 8x AF der GeForce4 Ti, akzeptiere ich weder beim R420 noch beim NV40 das stark winkelabhängige AF-Muster. Was die X800 angeht, reden wir über eine Karte mit 16 (oder 12) Pipes, guter FP24-Präzision (FP32 für gewisse Aufgaben) und vielen raffinierten Features die nur darauf warten, in zukünftigen Spielen ausgenutzt zu werden. Wir reden aber auch über eine Karte mit vielen Texturfilter-Präzisionsproblemen. Wenn man auch (mal ausgenommen die starke Winkelabhängigkeit) jedes einzelne Problem in Spielen kaum wahrnehmen kann, so steht am Ende zwar eine insgesamt noch gute, aber keine brilliante Texturqualität an die ich gewöhnt bin.
Angesichts der bisherigen Radeons hatte ich einfach mehr erwartet. Nicht unbedingt 3.0-Shader, aber zum Beispiel substanzielle Verbesserungen in den Pipelines. Mehr Performance, aber kein echtes Feature- oder Architektur-Upgrade seit Radeon 9700 ist alles, was ATI aufzubieten hat. Leider auch keine Verbesserungen betreffs Bildqualität. Wenn das auch für "Get in the Game" reicht, so bin ich persönlich nicht davon überzeigt, dass ein Fokus darauf was Spieler lediglich heute brauchen eine gute Langzeit-Strategie ist. Doch was das "hier und jetzt" angeht, ist selbst die X800 Pro eine exzellente Wahl, wie unsere Benchmarks beweisen.
Wir danken dem 3DCenter-Forum, vor allem Demirug und ram für ihre wertvollen Anregungen.
Außerdem wollen wir ATI danken, insbesondere Rene Fröleke und Friederike Weiss, für die tatkräftige Unterstützung.