ATI stellt erste PCI Express Grafikkarten vor
1. Juni 2004 / von aths / Seite 1 von 1
ATI stellt heute eine Serie von PCI-Express-Grafikkarten vor. Dabei handelt es sich um die bekannte X800 (es wird hier für die PCI Express Versionen keine extra Namen geben) sowie Radeon 9600 jeweils mit PCI-E-Steckplatz. Eigentlich gibt es also nichts neues. Doch nehmen wir uns die Zeit, etwas näher zu beleuchten, was ATI anzubieten hat.
"ATI Techologies Inc." – wofür steht eigentlich "ATI"? Ursprünglich sollte die Firma "Array Technologies Incorporated" heißen. Doch den Namen gab es in den USA schon. Also wurde daraus kurz "ATI", wobei das Kürzel seitdem für sich selbst steht, und keine Abkürzung des alten geplanten Namens darstellt.
ATI beschreibt die Vorzüge von einem nativen PCI-E-Interface in schillernden Farben. Als Argument wird unter anderem der Preis ins Feld geführt: Die Zukunft von AGP sei nur noch im Retail-Markt zu sehen, wo man die Mehrkosten einer Bridge noch unterkriegt, während PCI-E auch eine große Zukunft im OEM haben wird. Zudem deutet ATI an, dass eine native Lösung gegenüber einer Bridge auch Stabilitäts- und Performance-Vorteile haben könnte. Wir meinen, ob Bridge oder nicht, das ist dem Kunden egal, so lange die Grafikkarte das bringt, was man von ihr erwartet. Außerdem wird Nvidia ebenfalls native PCI-E-Chips haben, ebenfalls lange bevor es genügend Software gibt, welche die Vorteile von PCI-Express ausnutzen kann.
Nur hat Nvidia das Problem – oder, je nach Sichtweise, den Vorteil – sehr viel mehr Chips im Angebot zu haben. Alleine bei der FX-Serie sind es vier bis fünf: NV30, 31, 34, 35 (und 38). Für jeden Chip noch einmal mit PCI-E-Interface ein Tapeout machen zu müssen, würde teurer werden als auf den Bridge-Chip (HSI) zu setzen. ATI, deren PCI-E-Serie aus nur zwei Chips besteht, kann sich die "paar" Tapeouts leisten, um dafür an der Bridge zu sparen. Dabei gibt es R420 ja auch nativ für AGP, wobei der Chip intern mit 32xAGP laufen soll.
Übrigens wird die R360-Serie (Radeon 9800 /Pro/XT) für AGP fortgesetzt und nicht als PCI-E-Version angeboten. Weiterhin wird es die älteren Radeon-Versionen noch so lange für AGP geben, wie sie verkauft werden können. Jede PCI-E-Karte von ATI wird DirectX9-Beschleunigung bieten. (Nvidia hingegen verkauft in diesem Segment auch DirectX7-Lösungen). Wer hier gegenüber wem im Vorteil ist, das wird die Zeit zeigen.
Mit der Radeon 9600 /Pro hat sich ATI höchst erfolgreich in einen Markt behauptet, der mit dieser Karte überhaupt erst geschaffen wurde: "Spieletaugliche DirectX9-Beschleunigung zum kleinen Preis." Nvidia punktete zwar im Segment "DirectX9-Value" mit der GeForceFX 5200, während ATIs Angriffe dort mit der Radeon 9600SE bislang relativ erfolglos blieben. Die GeForceFX 5600 /Ultra hingegen ist für DirectX9-Spiele viel zu langsam, die GeForceFX 5700 /Ultra kam zu spät, und wurde vom eigenem Hause gleich wieder abgesägt (mit der besseren GeForceFX 5900XT). Die PCI-E-Version der Radeon 9600 heißt nun Radeon X600. Dabei handelt es sich aber um einen "normalen" RV360 mit dem PCI-E-Interface, und nicht um einen abgespeckten R420, wie das X im Namen andeuten könnte. Verwirrende Namensspiele sind wir ja leider gewohnt.
Leider funktioniert HyperZ beim RV360 nicht so, wie es sollte. Das kostet, je nach Spiel, ungefähr 10% Leistung (diese Angabe ist als grober Richtwert zu verstehen). Durch hohe Taktraten holt ATI das wieder heraus. Beim R420 wurde das Effizienzbündel "HyperZIII+", das jetzt HyperZ HD heißt, etwas aufgebohrt. Vor allem dem Cache kam das zugute, der dank größerem Umfang nun bishin zu 1920x1080 volle HyperZ-Effizienz gewährleistet. Frühere Radeons schafften das nur bis 1280x1024 – so nimmt die neue Stärke bei 1600x1200 auch nicht Wunder. Nach wie vor können bis zu 64 Quads pro Takt im Early-Z-System "gecullt" (vor dem Rendering verworfen) werden. Nvidia schafft selbst beim NV40 nur 16 Quads pro Takt. Ein Quad sind vier Pixel, die quadratisch als 2x2-Block angeordnet sind.
Die Sincos-Instruktion wurde im R420-Pixelshader verschnellert: Von acht Takten im 2_0-Profil zu einem Takt im 2_B-Profil. Das mag wie ein unbedeutender Tweak aussehen, jedoch leiten wir daraus einiges ab. Zunächst sieht ATI ein, dass man Funktionen lieber berechnen sollte als mit einem Texture Lookup zu arbeiten, weil die arithmetische Methode genauer ist. Nur sollte die Arithmetik auch schneller sein, und das ist jetzt endlich gewährleistet. Außerdem reagierte ATI hier wohl auf CineFX, welches von vornherein eine gegenüber 2_0 sehr schnelle Berechung bietet (soweit wir wissen, mit zwei Takten).
Daraus folgt dann wieder, dass R420 eben nicht nur ein zweifacher R360 mit einigen Bugfixes ist. ATI entwickelte die Pipelines dort weiter, wo sie sich den größten Nutzen versprachen. Bislang wurde Sincos über ein Makro realisiert, welches immerhin 8 Slots belegt (und die ersten Schritte der Taylor-Reihe ausführt). Der Verzicht auf das Shader Modell 3.0 ist bewusst gewählt. ATIs Hardware nutzt, genau wie Nvidia, "tiefe" Pipelines, mit denen sich Latenzen gut verstecken lassen. (so ist die "Durchlaufzeit" beim Sincos z. B. natürlich deutlich länger als ein Takt, aber man kann nach der "Anlaufphase" pro Takt eine solche Instruktion rechnen lassen).
Nachtrag: Die Verschnellerung der Sincos-Berechnung gilt nur für den Vertexshader. Im Pixelshader werden nach wie vor acht Takte benötigt. Der Vertexshader kann pro Takt entweder Sinus oder Cosinus berechnen.
Bei tiefen Pipelines Verzweigungen gestatten zu wollen, bedeutet, eine langsame Lösung in Kauf zu nehmen. Es ist ja nicht damit getan, den Registerinhalt des Zeigers auf den nächsten Programmschritt zu modifizieren. Nvidias aktuelle 3.0-fähige Pixelshader-Hardware ist trotz Optimierungen für das Shader Model 3.0 dementsprechend träge, wenn es ums Verzweigen geht: Für einige Takte liefert die Pipes keine neuen Ergebnisse (dass Verzweigungen lange Pipelines vor Problemen stellt, ist eine Sache, mit welcher auch Intel mit der Netburst-Architektur des Pentium 4 zu kämpfen hat).
Natürlich sind trotz allem mit dem Shader Model 3.0 sowohl Bildqualitäts- als auch Leistungsgewinne möglich. Diese wurden von ATI aber für jeweils klein genug gehalten, dass sie vorherst darauf verzichteten. Was die "3.0-Leistung" beim NV40 angeht, fehlen uns noch einige Details, als dass wir abschätzen können, wie weit sich die NV40-Architektur für 3.0 verbessern ließe. ATIs auf dem R300 basierende Technik ist für 3.0 jedenfalls ungeeignet. Immerhin soll der F-Buffer im R420 verbessert sein, was hilft, sehr lange Shader abzuarbeiten.
Im NV40-Artikel sprachen wir an, dass Nvidia seit NV30 "bessere" ROPs hat. NV40 hat 16 dieser "besseren" ROPs. R420 hat 32 "normale" ROPs. Diese sind allerdings nur dann auszulasten, wenn Multisampling-Antialiasing aktiv ist. Außerdem sind jeweils 2 ROPs "fest" an einer Pipe, während Nvidia die Z-Tests (und Alphablending-Rechnungen) seit dem NV40 per Crossbar auf die ROPs verteilen kann. Sofern Antialiasing im Spiel ist, müsste sich die höhere ROP-Rohpower beim R420 aber auszahlen. Dass die Benchmarks gerade beim 4x Antialiasing eher den NV40 im Vorteil sehen, könnte die Ursache haben, dass das Cache-System im NV40 möglicherweise besser optimiert ist, oder dass die HyperZ HD-Features in der Radeon treiberseitig noch nicht in Gänze erschlossen sind. Im überarbeitetem HyperZ sollte noch etwas Potenzial schlummern, welches zukünftige Treiber ausnutzen könnten.
So viel zur Technik. Bevor wird zu den nackten Fakten in Form von Zahlen kommen, eine Klärung bezüglich der Namen. Wie bereits erwähnt, basiert die X800 auf der neuen R420-Technik, die X600 und X300 nutzen den RV360-Chip, der um ein natives PCI-Express-Interface erweitert wurde. X600 und X300 unterscheiden sich nur in der Strukturgröße, X300 nutzt einen 0,11 µm-Prozess.
Radeon X300SE |
Radeon X300 |
Radeon X600 Pro |
Radeon X600XT |
Radeon X800 Pro |
Radeon X800XT |
Radeon X800XT-PE |
|
Slot & internes Interface | PCI Express | ||||||
Codename | RV370 | RV380 | R423 | ||||
Chip basierend auf | RV360 + PCI Express + 110nm Fertigung | RV360 + PCI Express | doppelter R360 + Verbesserungen + PCI Express + 130nm Fertigung | ||||
Herstellung | 75 Mill. Transistoren in 110nm, gefertigt bei TSMC | 75 Mill. Transistoren in 130nm low-k, gefertigt bei TSMC | 180 Mill. Transistoren in 130nm low-k, gefertigt bei TSMC | ||||
Technologie-Klasse | DirectX9 Shader 2.0 | DirectX9 Shader 2.0 | DirectX9 Shader 2.0 | ||||
Geometrie-Pipelines | 2 | 2 | 6 | ||||
Pixel-Pipelines | 4 | 4 | 4 | 4 | 12 | 16 | 16 |
Chiptakt | 325 MHz | 325 MHz | 400 MHz | 500 MHz | 475 MHz | 500 MHz | 520 MHz |
Speichertakt | 200 MHz | 200 MHz | 300 MHz | 370 MHz | 450 MHz | 500 MHz | 560 MHz |
Speicheranbindung | 64 Bit | 128 Bit | 128 Bit | 128 Bit | 256 Bit | 256 Bit | 256 Bit |
übliche Speicherausstattung | 64/128/256 MB DDR | 64/128 MB DDR | 128/256 MB DDR | 128/256 MB DDR | 256 MB GDDR3 | 256 MB GDDR3 | 256 MB GDDR3 |
Markteintritt | Juni/Juli |
Nonpro-Version sind jeweils nicht mehr vorgesehen. Warum? Eben darum, weil sich die Leute bei ATI am "Nonpro" störten. Anstatt z. B. Radeon 9800, 9800 Pro und 9800XT zu schreiben, wurde die 9800 oft mit "nonpro" ver(un)ziert. Jetzt gibt es nur noch Pro und XT. Zudem gibt es die "XT Platinum Edition". ATI gab zu, anfangs nicht genug Klarheit geschaffen zu haben, dass es eine Radeon X800XT und eine Radeon X800XT-PE gibt. Letztere ging an die Presse zum reviewen. Wie üblich bekommt die Presse die Highend-Version, welche dann fast gar nicht verkauft wird. Immerhin, während es von Nvidia Produkte wie GeForceFX 5200 Ultra oder GeForceFX 5600 Ultra gibt, deren "Existenzberechtigung" ausschließlich sich durch für Reviews bestimmte Exemplare begründen lässt, findet z. B. ATIs Radeon 9600XT eine Menge Freunde.
Radeon X300 ist praktisch eine alte Radeon 9600 und taktet die GPU mit 325 MHz, den Speicher mit 200 MHz. Die Radeon X300SE wird nur über einen 64 Bit breiten Speicherbus verfügen, womit diese Karte für keinen Spieler mehr infrage kommt, während der Gelegenheitsspieler mit der X300 recht gut bedient ist. Auf neueste Features kommt es in diesem Segment ohnehin nicht an, und für einen Preis, der wahrscheinlich nur zweistellig sein wird, hat man neben den Checklist-Features wie PCI-E und DirectX9 sogar die notwendige Leistung, um in mittleren Auflösungen Far Cry zu spielen.
Wer öfters spielt, ist mit der Radeon X600 Pro natürlich besser bedient, welche wie die Radeon 9600 Pro mit 400/300 MHz taktet. Wer wirkliche Power braucht, ohne sehr tief in die Tasche greifen zu wollen, wie es für ein Highend-Modell notwendig ist, bekommt mit der Radeon X600XT Spiele-Leistung, die sich sehen lassen kann. Denn gegenüber der Radeon 9600XT wurde der Speichertakt von 300 auf 370 MHz angehoben, und die GPU arbeitet weiterhin mit 500 MHz.
Nur vier Pipelines, nur 128 Bit RAM-Interface, ein HyperZ, das nicht in Gänze funktioniert, all das klingt nicht gerade "sexy". Doch solche Bedenken verflüchtigen sich, wenn man eine solche Karte erlebt: Erstaunliche Performance, selbst bei relativ hohen Auflösungen, selbst bei aktivierten Bildqualitäts-Einstellungen wie Antialiasing und anisotroper Filterung.
Kritisieren müssen wir den Begriff "High Definition Gaming" mit dem Unterpunkt "Breakthrough Image Enhancement Technology". Seit Radeon 9700 hat sich da ja nichts zum Besseren gewandelt. Antialiasing ist nach wie vor exzellent, die trilineare und vor allem anisotrope Qualität bleibt hingegen fragwürdig. Außerdem bietet der Pixelshader nur FP24-Genauigkeit. Das ist laut DirectX9 "Full Precision", aber die Konkurrenz überbietet das eben. Auch was Texturfilter-Qualität angeht: Beim 3Dc-Feature z.B. werden dem Feature Vorteile zugerechnet, die sich nur indirekt ergeben.
Für irreführend halten wir die Einordnung der X800 in "Ultra High End". Mag die Leistung auch unübertroffen sein (was je nach Benchmark-Serie der Fall sein kann, oder auch nicht), unserer Meinung nach gehören zu "Ultra High End" auch ultra-neue Features. Während der Vertexshader nach wie vor exakt dem 2_0-Profil entspricht, kann man mit dem Pixelshader 2_B-Profil deutlich weniger anstellen, als mit CineFX (also dem Profil 2_A) - und CineFX, seit dem Herbst 2002 auf dem Markt, ist nun nicht gerade taufrisch.
Wir sind es gewohnt, dass sowohl sehr kleine, als auch gar keine Verbesserungen neu vermarktet werden als "Breakthrough" in irgendeinem Feld. Auch Nvidia ist sehr geübt darin, das gleiche oder nur marginal verbesserte Feature unter neuem Namen zu verkaufen. Bei ATI müssen wir sachlich festhalten, dass die ganzen, umfangreichen PDFs nicht davon ablenken können, dass – trotz sinnvoller Verbesserungen, die wir besprochen haben – nach wie vor im Grunde die alte (oder, positiv formuliert, die bewährte) Radeon 9700 Technik geboten wird, nur mit unterschiedlichen Performance-Niveaus. Bislang sieht es so aus, dass ATIs Rechnung aufgeht: Auf bessere Features als R420 legen weniger Leute wert, als auf maximale Geschwindigkeit bei erträglicher Abwärme. Selbst die Radeon X800XT-PE in der AGP-Version kommt mit einem Stromstecker und akzeptabler Kühlerlösung aus.
Doch warum immer nur auf Spiele gucken? Immer mehr Anwender nutzen ihren PC als DVD-Player. Hier, das muss man auch einmal deutlich sagen dürfen, bietet ATI nach wie vor eine Lösung von einer Qualität, die wir bei Nvidia nicht im Ansatz feststellen konnten. Das liegt vor allem am Overlay, einer Technik, um skalierbaren Video-Inhalt einzublenden. ATIs Overlay zeichnet unserer Meinung nach feinere Details, und verfügt vor allem über eine Gamma-Korrektur. Auf 1,45 oder 1,7 gestellt, sieht die DVD auf Röhrenmonitoren viel besser aus.
Viele DVDs sind unserer Meinung nach auf Nvidia-Karten überhaupt nur erträglich, wenn man statt dem Overlay VMR nimmt. Dies ist eine unter Windows XP verfügbare Möglichkeit, Videofenster mit DirectX anzuzeigen. Im Gegensatz zum Overlay lässt sich davon sogar ein Screenshot machen, weil die Daten in den Framebuffer geschrieben werden, während sich das Overlay-Bild per Screenshot nicht speichern lässt. ATIs Overlay-Technik halten wir für besser als VMR-Qualität. Das heißt, wer gerne DVD-Video oder TV am PC sieht, ist mit einer Radeon derzeit besser beraten.
Im gleichen Zuge kritisieren wir die Bemühungen beider Marktführer, Benchmarks in der Auflösung 1600x1200, bei 4x Antialiasing und 8x anisotroper Filterung als Standard setzen zu wollen. Das geht voll am Anwender vorbei. Kaum jemand hat den Monitor für solche Auflösungen. Anstatt nur auf Auflösung zu setzen und dafür anisotrope sowie trilineare Qualität zu opfern, würden wir lieber eine Option auf volle Qualität sehen. Dass die heutigen Karten bei geringeren Auflösungen, sagen wir, 960 oder 1024 Zeilen, gar nicht mehr ausgefahren werden können, liegt schließlich auch am Zwang, keine volle Texturqualität mehr haben zu dürfen. Aber nicht jeder giert nur nach extremer Auflösung. Das Thema wollen wir an dieser Stelle nicht vertiefen, zumal wir in einer Kolumne unsere Ansicht hierzu bereits darlegten.
Das auffälligste Merkmal des neuen Line-Ups ist der höhere Speichertakt der Radeon 9600XT, die als PCI-E-Version jetzt Radeon X600XT heißt. Was PCI Express Grafikkarten angeht, werden allerdings keine Chips mit acht Pipelines angeboten. ATI bedient sowohl den Enthusiasten, als auch den Einsteiger/Mittelklasse-Markt, und spart das "Performance"-Segment noch aus. Man könnte diese Aufstellung so interpretieren, dass ATIs Meinung nach der Extrem-Spieler in einem System mit PCI Express sowieso keine Karte mit "nur" acht Pipelines haben will - oder aber, daß es dann doch noch irgendwann eine Radeon X800SE auf PCI Express mit nur 8 aktiven Pipelines geben wird ;-).
Update vom 4. Juni 2004:
Gemäß direkten Informationen seitens ATi können wir folgendes zur "normalen" Radeon X800XT ergänzen: Diese Karte wird es in der Tat geben - und zwar mit den Taktraten von 500/500 MHz. Derzeit ist aber nur eine Version auf PCI Express wirklich sicher, eine AGP-Version ist dagegen zwar möglich, aber noch nicht spruchreif. Damit zieht ATi derzeit bei den X800-Karten mit drei Versionen für PCI Express (X800 Pro, X800XT, X800XT Platinum Edition) und zwei Versionen für AGP (X800 Pro, X800XT Platinum Edition) ins Feld, hinzu kommt dann noch die (derzeit von ATi aber nicht offiziell bestätigte) Radeon X800SE mit nur 8 Pixel-Pipelines. Die "normale" Radeon X800XT wurde demzufolge obiger Tabelle hinzugefügt.