Zum 3DCenter Forum
Inhalt




nVidia NV30 und NV35 Spezifikationen (?)

22. Mai 2002 / von Leonidas / Seite 2 von 2 / Update 7. Juni


Dieser Artikel ist inzwischen schon wieder überholt, bitte beachtet das Update.


Eine weitere Spezifikations-Auflistung stammt aus dem Forum im Forum von x3dfx (ironischer geht es kaum), wobei sehr ähnliche Zahlen schon etwas länger (ca. einen Monat) durch das Web geistern:


Original Kommentar
NV30-Specs
AGP 4x and 8x Logisch nach der Verabschiedung der AGP 3.0 Spezifikation.
Copper Core GPU Processor 0.13 m default clock 450 MHz 0.13 micron wird es mit Sicherheit werden, ob es 450 MHz sein werden, wird die Zukunft zeigen müssen. Zumindestens für den NV30 erscheint dieser Takt etwas zu hoch gegriffen.
73 million transistors Hört sich ein bißchen zu wenig an, wenn man die ganzen Änderungen betrachtet, welche gegenüber dem GeForce4 Ti Core mit 63 Millionen Transistoren beim NV30 hinzukommen, 90-120 Millionen Transistoren sind eher realistisch. Allerdings - wenn es wirklich eine extra T&L-Einheit gibt, welche für sich ca. noch einmal 20-40 Millionen Transitoren besitzt, dann könnten diese 73 Millionen Transitoren rein für den eigentlichen Grafikchip durchaus passen.
8 pipes Das Thema hatten wir vorstehend schon einmal behandelt.
128 MB DDR-SDRAM @ 375 MHz x2 = 750Mhz and 256 bit yes 256 bit Das erste Karten "nur" mit 128 MB Grafikspeicher kommen, ist logisch, da sich nVidia wie immer die besseren Versionen für den Refresh NV35 oder aber für die jeweils höchstgetakteste Ausführung aufheben wird, um einen greifbaren Unterschied zwischen den Karten zu haben. 375 MHz Speicher wäre im Herbst machbar - aber: Ein 256bittiges DDR-RAM Interface würde hier eine Bandbreite von 24 GB/sec ergeben - zumindestens für den NV30 wohl zuviel. Es könnte aber sein, daß sich hier Spezifikationen vermischt haben und das diese Maximal-Angabe zum Refresh-Chip NV35 gehört. Diese 375 MHz Speichertakt passen jedenfalls erstaunlich gut zu der Angabe von 24 GB/sec Speicherbandbreite beim NV35 bei der anderen (vorstehenden) Spezifikations-Auflistung. Daß 256bittige DDR-RAM Speicherinterface wäre somit auch nach diesen Spezifikationen beim NV30 existent - allerdings natürlich mit deutlich niedrigeren Speichertakten.
370Mhz RAMDAC Sehr wahrscheinlich nach den 350 MHz bei der GeForce4.
DirectX 9.x compatible Wie schon vorstehend ausgeführt, gilt die vollständige DirectX9-Kompatibilität der kommenden nVidia-Hardware als gesichert.
Quad Vertex Shaders Will sagen: Der Vertex Shader wird vierfach ausgelegt sein wie z.B. bei Matrox´ Parhelia. Dies erscheint logisch, nachdem nVidia schon bei der GeForce4 Ti den Vertex Shader doppelt auslegte im Gegensatz zum einfachen Vertex Shader der GeForce3.
Dual Pixel Shaders In diesem Wortlaut ist dies erst einmal regelrecht falsch: Pixel Shader können nicht mehrfach ausgelegt sein, da jede Rendering-Pipeline automatisch über ihren eigenen Pixel Shader verfügt.
Lightspeed Memory Architecture III War zu erwarten, ohne das wir allerdings wissen, welche wirklichen Veränderungen sich hinter diesem Namen verbergen.
Quad Cache memory caching subsystem Hört sich interessant an, allerdings fehlt hierzu die Erläuterung, was man damit anfangen kann. Es hört sich jedoch erst einmal nach höherer Performance durch bessere Caches an.
Dual Z-buffers for greater compression without losses visibility subsystem Auch hier fehlt eine Erklärung - erst nach dieser wird man dieses interessant klingende Feature einschätzen können.
Advanced Hardware Anisotropic Filtering - A new 12nvx mode that delivers improved subpixel coverage, texture placement and quality. Hochtrabende Worte für eine inzwischen doch recht alte Sache: Einfach ein anisotroper Filter mit 12facher Stufe. Theoretisch kann man anisotropisches Filtern auch mit noch mit wesentlich höheren Stufen betreiben, es müssen nur die jeweiligen Rendering-Architekturen hierfür ausgerichtet sein. Update: Wahrscheinlich eine Fehlauslegung meinerseits, offensichtlich ist ein 12x anisotropes Filtern technisch kaum machbar (extrem unwahrscheinlich) und das Ganze muß immer in 2er Potenzen (4x, 8x, 16x ...) erfolgen.
12nvx mode should deliver 80% better subpixel coverage and placement than previous modes Ein 12x Anti-Aliasing Modus? Hört sich gut an - aber wenn man nVidia´s letzten Treibertrick kennt, wonach sich der 4xS Modus als "6x" ausgibt, relativiert sich dieses wohl wieder. Möglicherweise ist es ein echter 12x Modus mit 12 Subpixeln, möglicherweise aber nur ein "gefakter" 12x Modus mit 12 Abtastungen, aber weniger als 12 Subpixeln. So etwas ließe sich z.B. mit 6 Subpixeln und vollständig gedrehtem Abtastraster erreichen, dies wären dann 12 Abstastungen auf nur 6 Subpixel (zum Vergleich: Schon 3dfx´ 4x Anti-Aliasing kommt auf 8 Abtastungen). Update: Die wahrscheinlichste Lösung ist wohl ein Modus mit 8 Subpixel und 12 Abtastungen, sinngemäß gleich dem jetzigen "6x" Modus bei der GeForce4 Ti, welcher auf 4 Subpixeln und 6 Abtastungen basiert.
Hardware bumpmapping Da ohne genauere Angabe, welches Art von BumpMapping gemeint ist: Dies können schon die originalen GeForce-Chips.
4 Textures/Pixel in a single clock cycle, loop back can also apply an additional 4 textures per rendering pass Wenn die ersten 4 Texturen per pass ohne Loopback-Feature zustandekommen, kann dies eigentlich nur bedeuten, daß der NV30 über 4 Textureneinheiten pro Rendering-Pipeline verfügt, was eine gigantische 8x4 Architektur ergeben würde. Das mittels Loopback-Feature eine weitere Pipeline dann ihre Textureneinheiten zur Verfügung stellt und dann insgesamt 8 Texturen per pass herauskommen, ist logisch. Die 8x4 Architektur ist allerdings eine höchst unsichere Sache - nur ein mißverständlich geschriebener Begriff in der originalen Aussage und schon kommt etwas völlig anderes heraus. Spekulation: Möglicherweise bekommt ja nur der NV35 diese jeweils 4 Textureneinheiten und der NV30 hat weiterhin jeweils 2. Schon bei der GeForce 1/2 änderte nVidia mitten in einer Serie diese Anzahl der Textureneinheiten, dies könnte beim NV30/NV35 ebenfalls so sein. Update: Eine Mindestforderung von DirectX9 sind 16 Texturen per pass.
A separate second copper processor running at 450Mhz an 0.13m as well - handle all T&L now called TT&L (True Time and lighting) Kennen wir schon von der anderen Spezifikations-Auflistung her - nur dort wurde dies klar dem NV35 zugesprochen. Eventuell haben sich bei dieser vorliegenden Spezifikations-Auflistung wieder die Daten des NV30 und des NV35 vermischt.
NVAutoShaper a new prechached and precacheable system Ohne genauere Erklärungen, was sich dahinter verbirgt, läßt sich hierzu wohl nichts sagen.
Programmers can also add shapes to be temporarily stored in precache to speed things up Dito.
Latest OpenGL Will sagen: Der NV30 unterstützt diese OpenGL-Variante, die zum Zeitpunkt des Chipstarts veröffentlicht ist. Damit erscheint es auch logisch, daß NV30 und NV35 eigentlich komplett OpenGL 2.0 unterstützen, dies offiziell aber nur dem NV35 zugesprochen werden wird, da OpenGL 2.0 erst nach dem Start des NV30 offiziell vorgestellt werden wird. Die technischen Voraussetzungen für OpenGL 2.0 bringen aber wohl beide Chips mit sich.
Backward glide game capable thanks to NvBlur (Yes a new version of Glide!) Hier müssen wir den ersten Teil der Aussage strikt vom zweiten Teil trennen, den letzterer scheint eine persönliche Vermutung des Verfassers dieser Spezifikations-Auflistung zu sein. Ein NvBlur-Feature, welches ähnlich der Voodoo5 mittels deren T-Buffer einen Verwischungseffekt (Motion Blur) in Spielen erzielen kann, kann man für wahrscheinlich halten. Dieses alte 3dfx-Feature ist wohl einfachst in die neuen nVidia-Chips zu integrieren, da es sich fast nur um eine intelligente Ausnutzung schon vorhandener Buffer handelt. Dieses Feature hat aber überhaupt nichts mit Glide zu tun! Selbst bei 3dfx´ Voodoo5 zählte der T-Buffer nicht zu den Glide-Feature, 3dfx hatte die Weiterentwicklung von Glide schon vor der Voodoo5 eingestellt. Insofern gilt der erste Teil vorstehender Aussage als wahrscheinlich, der zweite Teil ist einfach ein Mißverständnis.
NView Multi-display Technology Wie in GeForce2 MX und GeForce4 gehabt.


Jetzt kommt der wohl kniffligste Teil: Der Versuch, aus diesen halbgaren und teils wild vermischten Spezifikationen einen Ausblick auf den im Herbst anstehenden nVidia NV30 Chip zu geben. Nachfolgende Tabelle ist natürlich enorm unter Vorbehalt zu sehen: 


Next Generation Graphics Chips (Fall 2002)
  Matrox
Parhelia
3Dlabs
P10
nVidia
NV30
Transistoren
(Mill.)
80 75 ca. 90-120
Fertigung
(µ)
0.15 0.15 0.13
Architektur
(Bit)
512 512 512 (?)
Rendering
Pipelines
4 4 8 (?)
Texturen
Einheiten (je)
4 2 2 (?)
Texturen
per pass
4 8 16
Chiptakt
(MHz)
Retail: 220
Bulk: 200
ca. 250 ca. 400
Füllrate
(GPixel)
Retail: 0,88
Bulk: 0,8
ca. 1,0 ca. 3,2
Füllrate
(GTexel)
Retail: 3,52
Bulk: 3,2
(bilinear)
ca. 2,0
(trilinear)
ca. 6,4
Speicher
Interface (Bit)
256 DDR 256 DDR 256 DDR (?)
Bandbreiten
Features
- Virtual Memory System Lightspeed Memory Architecture III
Speichertakt
(MHz)
Retail: 275
Bulk: 250
ca. 300 ca. 200-250
Bandbreite
(GB/sec)
Retail: 16,4
Bulk: 14,9
ca. 17,9 ca. 11,9-14,9
Vertex Shader
Ausführung
4fach 4fach 4fach
Vertex Shader
Version
2.0 2.0 2.0
Pixel Shader
Version
1.3 1.3 2.0
DirectX
Version
8.1
(Teile von 9.0)
8.1
(Teile von 9.0)
9.0
OpenGL
Version
1.3 2.0 1.3
(Teile von 2.0)
Anisotropes Filtern
(max. Stufe)
bilinear: 16x
trilinear: 8x
? ?
Anti-Aliasing
(max. Samples)
16x
(FAA)
8x
(MS)
8x (?)
Rendering
Genauigkeit
40 Bit
(fix)
mindestens 64 Bit
(fix)
64 Bit
(floating point)
Displacement
Mapping
ja ja ja
AGP-Spezifikation
(max. Modus)
3.0 (8x)
(erste Karten 2.0/4x)
2.0
(4x)
3.0
(8x)
Speicherausbau
(max. MB)
256 256 256
*  auf einer 1 GByte = 1024 Byte ^ 3 Basis


Die Änderungen des im Frühling 2003 nachfolgenden NV35 sind dann an einer Hand abzuzählen: Auslagerung der T&L-Einheit auf einen extra Chip, SLi-Unterstützung für die Karten des professionellen Segments, wahrscheinlich 4 Textureneinheiten pro Rendering-Pipeline, offizielle OpenGL 2.0 Unterstützung sowie die obligatorischen höheren Chip- und Speichertakte.

Ein Wort noch zum QDR-Speicher: Es wäre spekulativ durchaus möglich, daß nVidia kein 256bittiges DDR-RAM Interface einsetzt, sondern ein 128bittiges QDR-RAM Interface und dann gleichgetaktete QDR-RAMs einsetzt (200 bis 375 MHz). Das Problem sehen wir hier darin, daß QDR-RAM derzeit selbst von den hinter diesem Speicher stehenden Herstellern ganz klar als Speicher für Kommunikations-Geräte gesehen wird. Es ist allerdings ein gewaltiger Unterschied, 512 kByte große Speicherchips für irgendwelche Kommunikations-Geräte mit 300 MHz Taktrate herzustellen oder aber 8 MByte große Chips für Grafikkarten mit dem gleichen Takt.

Erschwerend kommt hinzu, daß QDR gegenüber DDR nur den Unterschied hat, anstatt wie DDR 2x pro Takt in den Speicher lesen oder schreiben zu können, QDR jeweils pro Takt 2x Schreiben und 2x Lesen kann. Um jedoch eine wirkliche Bandbreiten-Verdopplung mit diesem Verfahren erreichen zu können, müssen sich Schreib- und Lesevorgänge in der Gesamtheit zu 50:50 Anteilen gegenüberstehen, zudem sollte sich idealerweise pro Takt die Anzahl der Schreib- und Lesevorgänge auch immer noch möglichst gleichen. Da dies so gut wie niemals garantiert werden kann und diese 50:50 Ausgewogenheit je nach Aufgabenstellung selbst im besten Fall nie erreicht werden kann, bringt QDR-RAM eine sehr deutliche Ineffizienz gegenüber DDR-RAM mit sich. Insofern ist QDR-RAM auf Grafikkarten derzeit für sehr unwahrscheinlich zu halten, jedoch nicht unmöglich.

An dieser Stelle wollen wir den Spekulations-Mode dann ausschalten und uns nicht weiter darin ergehen, was sich nun aus diesen Zahlen ergibt. Die ganze Sache ist derzeit noch viel zu ungewiß, als das man jetzt schon irgendwelche Schlußfolgerungen gerade bezüglich der Performance ziehen wird. Daß einzige, was ziemlich sicher feststeht, wäre, daß der nVidia NV30 im Gegensatz zum Matrox Parhelia und zum 3Dlabs P10 DirectX9 vollständig unterstützen wird. An dieser Stelle bleibt aber natürlich noch der Herbstchip von ATi namens R300 abzuwarten, weil dieser genauso DirectX9 vollständig unterstützen wird.


Dieser Artikel ist inzwischen schon wieder überholt, bitte beachtet das Update.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back 3DCenter-Artikel - Index Home

Shortcuts
nach oben