kleine NV20 Spekulation

20. November 2000 / von Leonidas

3Dn Hardware will auf der COMDEX Fall 2000 in Las Vegas ein paar neue Details über den NV20 in Erfahrung gebracht haben, hier nachzulesen. Zusammen mit einigen anderen Informationen versuchte ich, ein etwas genaueres Bild vom künftigen GeForce2-Nachfolger NV20 zu zeichnen - und bin prompt auf eine noch zu klärende Unstimmigkeit gestoßen ...

Erste neue Information wäre, daß der NV20 mit der gleichen Anzahl an Pixel-Pipelines antreten wird wie der Vorgänger GeForce2 - das wären also also vier Stück. Das es mehr Textureneinheiten als vorher (zwei) werden müssen, ist zur vollständigen DirectX8-Kompatiblität (mindestens: drei) logisch. Schon vor einiger Zeit war über vier Textureneinheiten pro Pipeline spekuliert wurden. Zusammen mit diesen früheren Informationen ergibt sich also folgendes Bild:

	GeForce1	GeForce2	NV20
Herstellungs-Prozeß (micron)	0.22	0.18	0.15
Transistoren (Millionen)	23	25	50
Pixel- Pipelines	4	4	4
Textureneinheiten pro Pipeline	1	2	3 bis 4
Chiptakt (MHz)	120	200	ca. 300
Füllrate (GPixel)	0,48	0,8	ca. 1,2
Füllrate (GTexel)	0,48	1,6	ca. 3,6 bis 4,8
Speicherbandbreite (GB/sec.)	4,7 (DDR)	5,2	unbekannt

Ok, zu den Erklärungen: Die 50 Millionen Transistoren ergeben sich aus dieser älteren News von 3D Concept. Da sagte ein nVidia-Entwickler, daß man an Chips mit 25, 50 und 65 Millionen Transistoren arbeite, wobei der 65-Mill.-Koloß der X-Box-Chip NV2A sei. Die 25 Millionen haben sich inzwischen mit dem mobilen Chip "GeForce2 Go" geklärt, bleiben damit nun nur noch die 50 Millionen Transistoren für den NV20.

Die "drei bis vier" Textureneinheiten pro Pixel-Pipeline ergeben sich aus dem schon oben gesagten: Drei müßen es für einen DirectX8-kompaiblen Chip sowieso sein, vier wurde oftmals in früheren Spekulationen genannt. Rein für die Leistung des Chips sollte das keinen großen Ausschlag bei aktuellen Spielen geben. Bei künftigen Spielen wird man sehen müssen, ob diese wirklich die angebotene gigantische Renderleistung umsetzen können, bevor die Speicher-Bandbreite ausgeht.

Der Chiptakt basiert auf Logik: Die GeForce1 in 0.22 micron mit 23 Mill. Transistoren und 120 MHz Chiptakt entwickelte 18 Watt Verlustleistung. Die GeForce2 konnte dies trotz 2 Mill. mehr Transistoren und 80 MHz mehr Chiptakt aufgrund des 0.18 micron Herstellungs-Prozeßes auf 9 Watt senken. Der NV20 bringt nun die doppelte Transistoren-Anzahl, hat aber den 0.15 micron Herstellungs-Prozeß. Laut den Informationen von 3DnHardware wird man aber wieder stolze 15 Watt Verlustleistung abführen müssen. Unterhalb von 300 MHz sind diese 15 Watt nicht "erreichbar" - jedenfalls rein rechnerisch, ohne Berücksichtigung von Optimierungen, wie man sie z.B. bei mobilen Chips in Anwendung bringt.

Die Füllrate nach Mega-Pixeln und Mega-Texeln errechnet sich dann dementsprechend. Die Texelfüllrate ist aufgrund der ungewissen Anzahl der Textureneinheiten noch etwas vage. Wobei fraglich ist, ob dies außer den schön anzuschauenden Specs noch etwas bringt: Die GeForce2 bezieht ihren Hauptvorteil gegenüber der GeForce1 nach wie vor aus der höheren Speicherbandbreite und in nur geringem Maße aus der höheren Füllrate. Beim NV20 wird diese höhere Füllrate sicher noch viel weniger anschlagen, dafür ist die Speicher-Limitierung der aktuellen Chips (und wohl auch des NV20) zu groß.

Das Zauberwort heißt Speicher-Bandbreite. Und ausgerechnet darüber weiss man wie üblich nichts genaues. Fakt ist, nVidia wird mit ziemlicher Sicherheit keinen Tile-basierenden Renderer alá KYRO produzieren. Auch ein 256bittiges Speicherinterface (normal bei Grafikkarten sind 128 Bit) ist unwahrscheinlich, weil es den Chip wesentlich verteuern würde. Und DDR-Speicherchips sind auch im nächsten Jahr nur bis 4 ns (250 MHz) verfügbar, was die Speicherbandbreite zwar auf 7,8 GB/sec. heben dürfte, aber auch wieder eine höchst konstenintensive Lösung darstellt.

Womit ich beim Kernpunkt der Sache wäre: nVidia hat beim Sprung von GeForce1 zur GeForce2 im Endeffekt dem Chip nur eine überarbeitete T&L-Einheit (nicht platzrelevant) und vier weitere Texturen-Einheiten spendiert. Dies hat exakt 2 Millionen mehr Transistoren gekostet. Der NV20 soll nun auch nicht mehr als weitere vier oder weitere acht Textureneinheiten haben, was um die 2-4 Millionen weitere Transistoren bedeutet. GeForce2 mit 25 Mill. Transit. + 4 Mill. = 29 Millionen Transistoren. Was hat nVidia mit den übrig bleibenden ca. 20 Millionen Transistoren vor?

Natürlich müßen die Verhältnisse nicht exakt so sein wie bei der GeForce-Serie - nach dem nVidia/COMDEX-Bericht der Rivastation wird der NV20 schließlich eine komplette Neuentwicklungen mit vielen Änderungen am Core sein. Aber prinzipiell hat nVidia trotzdem noch weit über 10 Millionen Transistoren, welche erst einmal nicht über die Specs erklärbar sind. Und an dieser Stelle sind einige Varianten möglich: eine Technologie ähnliche ATi´s HyperZ zur Einsparen von Speicherbandbreite (allerdings wesentlich weiter ausgebaut), die programmierbare T&L-Einheit verschlingt dieses (kann die 20 Mill. Transistoren fressen?), doch weitere Pixel-Pipelines (6) - es gibt da einiges Spekulations-Potential.

Meine beste Idee zu diesem Thema wären allerdings im Chip integrierte Cache-Bausteine (ob nun als ein großer oder als viele kleine ist egal). Ungefähr 16 Millionen Transistoren sind für 256 kByte Cache gut - und da direkt im Chip eingebettet, wäre das Problem der zu kleinen Speicherinterfaces nicht mehr relevant. Das hört sich nicht nach viel an - allerdings geht es nicht darum, den kompletten Front- und Backbuffer (diese Bereiche, in denen das aufzubauende und das schon fertige Bild gespeichert werden) in den Cache zu legen, daß würde um die 10 MB verlangen. Vielmehr könnten diese Caches sehr viele Speicherzugriffe z.B. bei Mehrfach-Texturierung ersparen helfen und damit einiges an Last von der Speicher-Bandbreite zum Grafikkarten-RAM nehmen. Es geht letztendlich um die Einsparung von Speicherbandbreite - daß einzige, was den Chip wirklich schneller machen würde als seine Vorgänger.

Dies ist natürlich nur meine persönliche Spekulation. Sie klingt aber im Kontex des zu lösenden Bandbreiten-Problems nicht gleich ganz verrückt. Und ein was scheint doch ziemlich sicher: Im NV20 schlummern 10-20 Millionen Transistoren, die noch mit irgendwas zu belegen sind. Wir sind gespannt, mit was uns nVidia Anfang nächsten Jahres (Januar?) bei der Vorstellung des NV20 überraschen wird ...

Home Artikel-Index