S3 DeltaChrome Spezifikationen
19. Dezember 2002 / von aths & Leonidas / Seite 3 von 4
Update vom 22. Dezember 2002:
Bei S3 sind die den DeltaChrome-Chip betreffenden "coming soon" Seiten einer "DeltaChrome Feature Definitions" Seite gewichen, welche die in den wieder zurückgezogenen White Papers getroffenen Aussagen nochmals offiziell gestätigt. Leider ergibt sich durch den sehr knappen Text nur eine einzige neue Information zum DeltaChrome: Der Chiptakt wird 300 MHz betragen, resultierend aus der bekannten 8x1 Architektur und der von S3 mit 2,4 GB/sec angegebenen Füllrate. Damit legt sich S3 an das untere Ende der bisher geschätzten Skala von 300 bis 400 MHz Chiptakt - in gewissem Sinne auch ein Zeichen für die eher Mainstream- oder gar LowCost-Ausrichtung des S3-Chips.
Update vom 8. Januar 2003:
Bei S3 hat man sich nun auch zu einer offiziellen Presseerklärung bezüglich des DeltaChrome DirectX9-Grafikhips aufgeschwungen, unter anderem hier nachzuschlagen, ohne allerdings irgendetwas neues oder ein Sterbenswörtchen zum Termin zu sagen. Dafür aber wurden die Angaben auf der S3-Webseite erweitert, welche nun auch die Ausführungen der letzteres Jahr schon einmal kurzfristig und damals offenbar nur versehentlich verfügbaren White Papers enthalten. Neben sehr detaillierten Beschreibungen zu den Video- und anderen non-3D-Features des DeltaChrome sind aber auch einige neue Informationen bezüglich der 3D-Fähigkeiten abgefallen.
So unterstützt der S3 DeltaChrome bis zu 256 MB Grafikkartenspeicher und die schon bekannte Füllrate von 2.4 GPixel/sec (ergo 300 MHz Chiptakt) ist trilinear, womit sicher gestellt ist, daß der Chip ohne (relevanten) Leistungsverlust trilinear filtern kann (sollte heute selbstverständlich sein, aber diverse LowCost-Projekte beweisen ab und zu das Gegenteil). Der DeltaChrome unterstützt zudem neben den schon bekannten Features auch noch "Programmable Selective Depth-of-Field", ein Feature der Voodoo5 und GeForce3, welches bisher allerdings noch nicht zum Einsatz in Spielen gekommen ist.
Interessant sind die DirectX9-Fähigkeiten des DeltaChrome, den hier hebt sich dieser wider Erwarten vom DirectX9-Standard (Radeon 9700 Pro) ab und rangiert beim Vertex Shader auf der Höhe einer GeForceFX, beim Pixel Shader auf der Höhe einer Radeon 9700 Pro. Die Bezeichnung "2.0+" für den DeltaChrome Vertex und Pixel Shader hat sich S3 somit also redlich verdient:
ATi Radeon 9700 Pro |
nVidia GeForceFX 5800 Ultra |
S3 DeltaChrome |
|
DirectX Version | 9.0 | 9.0+ | 9.0+ |
High Order Surfaces | Ja | Ja | ? |
Continous Tesselation | Ja | Ja | ? |
Vertex Displacement Mapping | Ja | Ja | ? |
Geometry Displacement Mappping | Ja | Ja | ? |
Vertex Shader Version | 2.0 | 2.0+ | 2.0+ |
maximale Instruktionen | 1024 | 65536 | 65536 |
maximale statische Instruktionen | 256 | 256 | ? |
maximale Konstanten | 256 | 256 | ? |
temporäre Register | 12 | 16 | 16 |
maximale Loops | 4 | 256 | 256 |
Conditional Write Masks | - | Ja | Ja |
Call & Return | - | Ja | Ja |
Static Control flow | Ja | Ja | ? |
Dynamic Control flow | - | Ja | ? |
Pixel Shader Version | 2.0 | 2.0+ | 2.0+ |
maximale Texturen | 16 | 16 | 16 |
maximale Texturen Instruktionen | 32 | 1024 | ? |
maximale Farb Instruktionen | 128 | 1024 | 128 |
maximale Instruktionen Slots | 160 | 1024 | 160 |
Maximaler Temp Storage | 12 | 64 | ? |
Rendering Format | Floating Point | Floating Point | Floating Point |
Maximale Rendering Genauigkeit | 96 Bit | 128 Bit | 96 Bit |
Instruction Predicates | Ja | Ja | ? |
Unlimited Dependet Textures | - | Ja | ? |
Swizzling | - | Ja | ? |
Advanced Instructions | - | Ja | ? |
Conditional Write Masks | - | Ja | ? |
Mindestens ebenso interessant ist aber auch das sogenannte "Deferred Rendering with a Two-Pass Rendering Scheme", damit würde "Front-to-back, Back-to-front Z occlusion culling" möglich. "Front-to-Back Z occlusion culling" beherrschen bereits GeForce3, GeForce4 MX (jedoch nicht Ti) und die Radeon-Serie ab der 8500, ein "Back-to-front Z occlusion culling" erfordert dagegen deferred Rendering. S3 geht dabei allerdings nicht den Weg von PowerVR, sondern setzt einen zusätzlichen Rendering-Pass ein, welcher den Z-Buffer vorrendert, so daß dann das eigentliche Rendering mit herkömmlichen "Front-to-Back Z occlusion culling" beschleunigt wird. Zu gut deutsch: Der DeltaChrome macht eine zusätzliche Tiefenberechnung vor dem eigentlichen Rendering-Vorgang, anhand dieser Berechnung dann die unsichtbaren Pixel aussortiert werden.
Die Effizienz von PoverVRs Lösung wird S3 jedoch kaum erreichen können, denn der KYRO führt die Unsichtbarkeits-Berechung mittels extra Hardware parallel zum eigentlichen Rendering-Vorgang "for free", das heißt ohne Leistungseinbuße aus, während der DeltaChrome hierfür einen zusätzlichen kompletten Rendering-Pass braucht. Da die meisten Spiele-Engines ohnehin eine (grobe) Sortierung der Dreicecke vornehmen und auch ansonsten den Overdraw nach Kräften zu minimieren versuchen, wird dieses Feature wohl keine Wunder vollbringen können, nichts desto trotz ist es ein interessanter Ansatz. Ob das ausreicht, um ATi & nVidia Paroli bieten zu können, wird man sehen müssen, zumindestens stehen die Vorzeichen des S3-Chips nach der Offenlegung dieser Fakten durchaus positiver.