Zum 3DCenter Forum
Inhalt




3dfx Voodoo5-5500 Review

21. Oktober 2000 / von Peter Gräber (HardTecs4U) und Leonidas / Seite 2 von 10



      Technik

VSA100-Chip

Herzstück der Karte sind die beiden, in 0.25 Micron gefertigten, VSA100 (Voodoo Scalable Architecture) Chips, welche unter zwei aktiven Lüftern mit je 14 Millionen Transistoren und je 2 Pixelpiplines werkeln. Jede dieser Piplines, bietet wiederum eine Textureneinheit. Jeder dieser Chips ist in der Lage, eine Füllrate von 333 bis 367 Millionen Pixel oder 333 bis 367 Texel pro Sekunde je nach Chiptakt (166 bis 183 MHz) zu liefern.

Dadurch kommt die Voodoo5-5500 bei Verwendung beider Chips mit ihren 166 MHz Chiptakt auf eine Füllrate von 667 MPixel/s und 667 MTexel/s. Zum Vergleich: Ein GeForce256 erreicht mit seinen 4 Pipelines eine Füllrate von 480 MPixel/s und 480 MTexel/s, der GeForce2 GTS erreicht mit seinen 4 Pipelines und 2 Textureneinheiten pro Pipeline bereits 800 MPixel/s und 1600 MTexel/s.

Die Steuerung dieses Dual-Chipsytems übernimmt 3dfx' SLi-Technik (Scan Line Interleave). Dadurch wird die Arbeit beider Chips effizient verteilt und jeder Chip ist für sich in der Lage, unabhängig von dem anderen zu arbeiten. So ist es z.B. möglich, dass einer der Chips Daten liest und der andere gleichzeitig Daten schreibt, da jedem Chip auch 2 Pipelines und je ein 128 Bit Speicherinterface zur Seite stehen. In Einzelchipsystemen ist dies nicht möglich. Dort muss ein Arbeitsgang (also entweder Schreiben oder Lesen) beendet sein, bevor die Pipeline wieder Zugriff auf das Speicherinterface erhält.

Kühlkörper

Ob diese theoretischen Vorteile die durchaus einzige Entscheidung für 3dfx waren, diesen Weg der Chipbestückung zu wählen oder ob auch Herstellungskosten und Flexibilität in die Entscheidung mit einflossen, bleibt dahingestellt. Die Möglichkeit, Grafikboards mit ein, zwei und vier Chips basierend auf der identischen Chip-Familie auf den Markt zu bringen, ermöglicht 3dfx es jedoch, in jedem Marktsegment eine sowohl aktuelle als auch preislich passende Lösung anbieten zu können.

Dadurch, dass jeder VSA100 Chip ein eigenes 128 Bit Speicherinterface bietet, verdoppelt sich auch das Speicherinterface der Voodoo5-5500 virtuell auf 256 Bit. So wird erreicht, dass die 2x32 MB, mit 166 MHz taktenden, 6ns SDR-RAM (Single Data Rate) auf eine Bandbreite von 5.300 MB/s kommen, was exakt der Bandbreite einer GeForce2 GTS mit DDR-RAM (Double Data Rate) entspricht.

Speicherbestückung



      Features

Der wohl wesentlichste Punkt bei der Voodoo5 ist im Anti-Aliasing, der Kantenglättung, zu finden. Die Voodoo5 setzt zur Kantenglättung auf das T-Buffer-Anti-Aliasing, wobei mehrere nur minimal versetzte Bilder der selben Szene in einen extra Speicherbereich, den T-Buffer, gerendert und dort später miteinander verschmolzen werden. Beim 2fach AA sind dies 2 Bilder und beim 4fach AA 4 Bilder, welche die Voodoo5 für FSAA für ein und das selbe Endbild berechnen muß. Nachstehende Grafik von 3dfx soll die allgemeine Funktionsweise etwas besser veranschaulichen:

3dfx´ T-Buffer-Verfahren

Dies ist ein anderes Verfahren, als dies nVidia und mittlerweile auch ATi in ihren Chips verwenden. Dort wird bekanntermassen die Szenerie entsprechend "gestreckt" berechnet und dann später vor der Ausgabe auf den Monitor wieder herunterskaliert. Bei einer vom Anwender gewählten Auflösung von 800*600 und der Einstellung 2x2 FSAA rendern die nVidia- und ATi-Chips intern das Bild in der Größe 1600*1200 - um es dann vor der Ausgabe wieder auf 800*600 "zusammenzustauchen". Wenn wir das einmal am Beispiele von 4fach Anti-Aliasing verdeutlichen dürfen (3dfx 4x, nVidia 2x2): Bei 3dfx werden vier Bilder berechnet und bei nVidia die vierfache Bildgröße.

Beiden Methoden gemein sind jedoch die ungeheuren Anforderungen an die Hardware - im vorgenannten Fall von 4xFSAA müssen 3dfx- und nVidia-Chips schließlich jeweils die vierfache Menge an Bildpunkten zeichnen, um zum selben Bild zu kommen wie ohne FSAA. Hier zahlen sich die im eigentlichen überdimensionierten Spezifikationen der heutigen HighEnd-Grafikchips zum einen deutlich aus und werden zum anderen auch dringend benötigt. Während die reine Chipleistung (Füllrate) bei den heutigen Grafikboards schon im Überfluß vorhanden ist, krankt leistungsfähiges FSAA momentan an der zur Verfügung stehenden Speicherbandbreite. Hier macht sich die zuerst merkwürdig anmutenden DualChip-Architektur der Voodoo5 bezahlt - haben doch beide Chips ein eigenes 128bittiges Speicherinterface und bringen so alle Voraussetzungen für gute Leistungen unter FSAA mit.

Mit dem T-Buffer wird ein weiteres Feature ermöglicht, genannt Motion Blur, welches Bewegungsunschärfe bedeutet. Dadurch sollen ruckartige Übergänge in computergenerierten Bewegungen entfernt und gleichzeitig die Bewegung selbst und ihre Geschwindigkeit verdeutlicht/hervorgehoben werden. Dabei kann entweder das vordergründige Objekt der Szene scharf und der Hintergrund unscharf, oder aber Hintergrundschärfe und vordergründige Unschärfe verwendet werden, um dies zu erreichen - im Prinzip wie bei Filmen. Auch hier nochmals zur Verdeutlichung ein 3dfx-Screenshot:

Motion Blur

Ein weiterer wesentlicher Unterschied findet sich bei der Texturenkompression. 3dfx setzt hier nicht, wie viele andere Hersteller, auf S3TC, also das von S3 zur Texturkompression entwickelte Verfahren, sondern wartet mit einem eigenentwickelten Verfahren, genannt FXT1, auf. Hierbei wird die zu komprimierende Textur vor der Kompression in mehrere Teilbereiche aufgeteilt und erst dann wird jeder dieser Bildbereiche durch einen von 4 Kompressions-Algorithmen komprimiert. Verwendet wird hier dieser Algorithmus, welcher die wenigsten Fehler bei diesem speziellen Bildausschnitt produziert. S3 verwendet zur Kompression lediglich einen Algorithmus - und muß so immer mit dem Problem eines sichtbaren Komprimierungsverlustes kämpfen. Und nochmals zur Veranschaulichung einige Pics:

OriginalOriginal
FXT1FXT1  S3TCS3TC

In der Mitte der Bilder sind beide Verfahren gleich - aber an den aussen gelagerten Farbklecksen sieht man deutlich die Nachteile von S3TC gegenüber FXT1. Hier kann es den vorbeschriebenen Vorteil der mehreren möglichen Algorithmen deutlich darstellen - jeder Teil des Bildes wird extra mit dem für diesen Teil sinnvollen Algorithmus komprimiert. FXT1 wird momentan allerdings noch von keinem Spiel unterstützt. 3dfx hat dieses Verfahren jedoch zu Open Source erklärt - gut möglich, dass es sich in der Zukunft gegen S3TC durchsetzen kann. Die Voodoo5 unterstützt allerdings nicht nur das hauseigene FXT1, sondern über DirectX auch - wie jeder neuere Chip - die S3TC-Variante DXTC. Diese Unterstützung ist natürlich nur auf Direct3D-Spiele beschränkt - in OpenGL (Q3A und Clones) bedient sich 3dfx eines Treibertricks, mit welchem die von Quake ]I[ Arena unterstützte S3TC-Komprimierung mittels FXT1 ausgeführt wird. Die Voodoo5 kann allerdings nicht mit schon vorkomprimierten Texturen umgehen (S3-Levels für Q3A oder die Extra-Texturen von UT) - dafür fehlt 3dfx die S3TC-Lizenz unter OpenGL.

Denjenigen unter Euch, welche noch tiefer in die Materie VSA100 und T-Buffer einsteigen möchten, empfehlen wir an dieser Stelle den brillanten Artikel von 3D Concept. Wir für unseren Teil wenden uns nun der Praxis zu.






zurueck          weiter  

Shortcuts
nach oben