Zum 3DCenter Forum
Inhalt




Die aktuelle Entwicklung bei S3 Graphics

22. November 2005 / von robbitop / Seite 3 von 4


   Die aktuelle und zukünftige Modellreihe

Nachfolgend eine kurze Übersicht der vergangenen, aktuellen und angekündigten Grafikchips von S3:


  DeltaChrome S8 Pro GammaChrome S18 Nitro Chrome S19
(nie erschienen)
Chrome S25 Chrome S27
Fertigung 130nm TSMC 130nm TSMC 90nm Fujitsu 90nm Fujitsu 90nm Fujitsu
Shader Model 2.0 2.0 2.0 2.0 2.0
Vertex Shader 4 4 4 4 4
Pixel Shader 8 4 8 8 8
Pixel-Pipelines 8 4 8 4 4
TMUs 8 4 8 4 4
Chiptakt 300 MHz 450 MHz 500 MHz 600 MHz 700 MHz
Speichertakt 300 MHz 450 MHz 500 MHz 400 MHz 700 MHz
Speicherinterface 128 Bit DDR 128 Bit DDR
(OEM-Versionen mit 64 Bit DDR)
128 Bit DDR 128 Bit DDR
(OEM-Versionen mit 32/64 Bit DDR oder auch mit "AcceleRAM")
128 Bit DDR
Geometrieleistung 300 Mtri/s 450 Mtri/s 500 Mtri/s 600 Mtri/s 700 Mtri/s
Füllrate 2400 Mpix/s 1800 Mpix/s 4000 Mpix/s 2400 Mpix/s 2800 Mpix/s
Speicherbandbreite 8,9 GB/s 13,4 GB/s 14,9 GB/s 11,9 GB/s 20,9 GB/s
MultiChip-fähig nein nein ? nein MultiChrome
Markteinführung Anfang 2004 Mitte 2005 geplant Ende 2005
(nie erschienen)
geplant Anfang 2006 geplant Anfang 2006
Zielmarkt (bei Launch) unterer Mainstream LowCost/OEM unterer Mainstream
(nie erschienen)
LowCost/OEM unterer Mainstream


Mit der Chrome-S2X-Serie bohrt S3 Graphics das Columbia Design nochmals ordentlich auf. Der Schwerpunkt dieser Architektur ist ganz klar die aritmetische Leistung und weniger die Texturleistung. Leider beherrschen die Shader ALUs der Columbia-Architektur bis heute kein Co-Issue, das verschenkt unnötig viel Leistung. Weiterhin erkannte S3, dass die Entwicklung einer Steuerlogik der Quadpipelines für Columbia zu kosten- und zeitintensiv gewesen wäre und setzt somit auf nur eine Quadpipeline, hohe Effizienz und hohen Takt. Dies könnte der Grund sein, warum der eigentlich ebenfalls geplante GammaChrome S19 trotz überlegener Rohleistung nie veröffentlich wurde (siehe Tabelle).

Einigen Schwächen zum Trotz verdiente sich S3 Graphics mit dem konsequenten zweimaligen Erweitern einer bestehenden Architektur unseren Respekt. Laut ersten Benchmarks im Netz zeigt das Flagschiff der Chrome-S2X-Serie, die Chrome S27, eine ähnliche Leistung wie die GeForce 6600 DDR2 und die Radeon X1300 Pro - also ein definitiv konkurrenzfähiges Ergebnis.


   Performancebetrachtung DeltaChrome - GammaChrome

Da wir trotz stetiger Bemühungen nicht selbst über ein GammaChrome S18 Sample verfügen, mussten unsere Analysen mit den Ergebnissen von Beyond3D und eigenen Nachtests mit dem DeltaChrome S8 auskommen. Betrachtet wurden lediglich synthetische Tests, welche ziemlich systemunabhängig vergleichbare Ergebnisse liefern. Jedoch sind diese Aussagen ohne eigenes Testsample noch ohne Gewähr.

Eines nehmen wir vorweg: Trotz nur der Hälfte der Pipelines ist der GammaChrome S18 schneller als der DeltaChrome S8. Woran liegt das? Nur an den oben genannten Chip-internen Verbesserungen? Um das herauszufinden, müssen wir einige Dinge nochmals aufrollen. Dazu betrachten wir den GammaChrome S18 Nitro: Dieser wird mit 450 MHz Chip- und Speichertakt betrieben, im Gegensatz zum DeltaChrome S8 mit 300/300 MHz.

Rechnet man die Rohfüllrate beider Grafikchips aus, so verfügt der DeltaChrome S8 über rund ein Drittel mehr. Allerdings kann der DeltaChrome diese Füllrate in den seltensten Fällen auf die Straße bringen. Erstens aufgrund des oben beschriebenen Verschnitts bezüglich der Quad Pipeline Kontrolllogik und zweitens aufgrund der viel zu geringen Bandbreite.

Der GammaChrome hingegen leidet an keinem der beiden Probleme. Er besitzt rund 50% mehr Bandbreite, welche er, dank seines zweifach unterteilten Speichercontrollers, noch dazu viel effektiver nutzen kann. Die effektive Füllrate des GammaChrome S18 sollte also je nach Situation (Dreiecksgröße, Anzahl von Texturlayern) ebenbürtig oder sogar höher ausfallen als die des DeltaChrome S8.

Heutige IMRs können bereits viele verdeckte Objekte beim Rendern einfach "weglassen", das steigert die Effizienz. Details dazu sind im vorherigen Artikel zu finden. Oft entscheidet über die letztendliche Spiel-Performance, wie gut dieses Verwerfen von verdeckten Objekten funktioniert. "GL_EXT_REME" (ein Programm von Humus) misst die Z-Rejection Leistung in einem speziellen synthetischen Benchmark.


GL_ext_reme DeltaChrome S8 Pro GammaChrome S18 Nitro
3x Overdraw: Back to Front 257 fps 485 fps
3x Overdraw: Front to Back 584 fps 1113 fps
3x Overdraw: Random 387 fps 718 fps
8x Overdraw: Back to Front 107 fps 198 fps
8x Overdraw: Front to Back 514 fps 1020 fps
8x Overdraw: Random 269 fps 510 fps


Für das Z Rejection sind die HSR-Unit und die ROPs verantwortlich. In "traditionellen" Pipeline-Architekturen, wie dem DeltaChrome-Design, skaliert dies also mit der Anzahl der Pipelines und dem Takt. Auffallend ist, dass der GammaChrome eine enrom höhere Z Rejection Leistung an den Tag legt, trotz vermeintlich geringerer Rohleistung. Wir vermuten, dass der hierarchische Z Puffer, welcher in einem Schritt sehr viele Pixel verwerfen kann, nun vollständig funktioniert. Dies war beim DeltaChrome noch nicht der Fall.

Zur Berechnung von realistischen Schatten werden heutzutage Stencil Shadows genutzt. Beispiele hierfür sind Spieletitel wie Riddick und Doom 3. Ein exzessiver Einsatz von Stencil Shadows fordert natürlich eine hohe Stencil-Performance. Diese hängt maßgeblich von den Fähigkeiten und der Anzahl der ROPs in der GPU ab. Im vorangegangenen Artikel attestierten wir dem DeltaChrome trotz seiner 8 ROPs eine geringe Stencilperformance mittels des Fable Marks.

Um Stencil Shadows effektiv aufzutragen und dabei den Overdraw zu reduzieren, wird oft ein Z First Pass genutzt, in dem der Z Buffer im ersten Pass vorgerendert wird. Es sind zwar nun zwei statt nur einem Renderpass nötig, jedoch entfällt ein Grossteil des Overdraws - der Hauptrenderpass wird also inkomplexer. Um einen schnellen Z Pass zu garantieren, muss die GPU eine hohe Z Leistung besitzen. Beides wird im Game Test 2 "Battle of Proxycon" vom 3DMark2003 exzessiv genutzt. Somit ist dies ein guter Indikator für die Z-/Stencil Performance eines Grafikchips.


3DMark03 DeltaChrome S8 Pro GammaChrome S18 Nitro
Game Test 2 15 fps 33 fps


Der GammaChrome scheint in den ROPs starke Verbesserungen im Bereich Z-/Stencil erfahren zu haben. Taktnormalisiert ist eine GammaChrome Pipeline im Z-/Stencil Bereich im GT2 also rund 3x so schnell wie eine DeltaChrome Pipeline. Dies hört sich nach viel an, jedoch ist dies gerade mal eine Normalisierung eines zuvor sehr kritischen Zustandes.

Der erhöhte Chiptakt kann die Rohleistung beinahe wieder aufwiegen. Hinzu kommt, dass eben die Effizienz des GammaChromes deutlich höher als die des DeltaChromes ist. Hier entfällt ein Grossteil des Verschnitts da, sich beim GammaChrome nicht zwei Quadpipelines ein Dreieck teilen müssen. Weiterhin ist die Bandbreite relativ zur Füllrate deutlich gestiegen, so dass der GammaChrome S18 einen deutlich höheren Teil seiner Rohfüllrate als der DeltaChrome S8 in den Framebuffer schreiben kann. Die praktische Füllrate dürfte beim GammaChrome also höher sein als die des DeltaChromes. Die Pixelshader- und Vertexshader-Leistung sind ebenfalls gestiegen. Weiterhin sind die oben erwähnten unschönen Bugs entfernt worden, so dass viele Situationen problemloser werden sollten.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back Weiter / Next

Shortcuts
nach oben