Zum 3DCenter Forum
Inhalt




AGPx8 - Technik und Ausblick

26. August 2000 / von Leonidas


... "mit AGPx8 will Intel die Grafikperformance verdoppeln" ... "Geschwindigkeit von 533 MHz" ...

Das schreit ja gerade zu nach einer Wortmeldung von mir. Denn die Sache mit den 533 MHz ist erst einmal kompletter Unsinn - leider betet Intel diesen Mist auch noch denjenigen, die es hören wollen, höchstselbst vor. Aber hier sollte man Marketing von Technik unterscheiden, wenn Presseabteilungen etwas von "verdoppeltem Takt" sprechen, muß das noch lange nicht so sein.

Zur eigentlichen News-Meldung zurück: Intel wird dieser Tage die AGPx8-Spezifikation vorstellen. Durch AGPx8 wird laut Intel die theoretische maximale Bandbreite von AGP auf 2 GB/sec. klettern, was einer Verdopplung zur theoretischen maximalen Bandbreite von AGPx4 (und einer Verachtfachung im Vergleich zu AGPx1) gleichkommt. Da Intel in seiner Pressemitteilung den Pentium 4 explizit erwähnt, ist davon auszugehen, daß zukünftige Pentium4-Mainboards gleich AGPx8 beherrschen werden (so lange die Chipsätze von Intel sind - versteht sich). Nebenbei sichert sich die Marketingabteilung von Intel damit auch schon wieder ein tolles Argument ob der Vorzüge des Pentium 4 - solange es AGPx8 vorerst nur beim Pentium 4 geben wird, wird diese CPU ja fast schon automatisch zum Pflichtkauf ;-))

Ein AGPx8-Chipsatz für die "alten" P2/P3-Typen scheint dagegen eher ungewiss und ist auch nicht angekündigt. Dadurch, daß Intel die Hand auf AGPx8 hält, dürften auch VIA, AMD und ALi nicht so schnell AGPx8 auf ihren Mainboard-Chipsätzen anbieten können. Unabhängig dessen haben die Grafikkarten-Hersteller Matrox und nVidia in ersten Stellungnahmen ihre Unterstützung angekündigt, mit der baldigen Wortmeldung von ATi ist zu rechnen. 3dfx hingegen scheint bei Intel irgendwo nicht mehr all zu beliebt zu sein - man wird nicht einmal in Intels Presseerklärung erwähnt. Allerdings legte 3dfx auch in der Vergangenheit keinen großen Wert auf die Ausnutzung der von Intel teilweise stark gepuschten Standards AGPx2 und AGPx4. Selbst die aktuellen Produkte Voodoo 4/5 arbeiten nur im AGPx1-Modus - was aus Sicht von 3dfx kein Nachteil ist (und für den Käufer erst einmal auch nicht, solange das Produkt zufriedenstellend funktioniert).

Wie funktioniert nun AGPx8 und woher kommt die Verdoppelung der Bandbreite und was ist mit den 533 MHz?

Dazu ist der Blick zurück auf AGPx1, AGPx2 und AGPx4 notwendig:

AGPx1
AGP-Taktsignal (CLK): 66 MHz
Daten werden auf der fallenden Flanke des CLK-Signals (mit 66 MHz) übertragen
4 Bytes pro Takt = theoretische maximale Bandbreite 267 MB/sec.

AGPx2
AGP-Taktsignal (CLK): 66 MHz
Daten werden auf der steigenden und der fallenden Flanke der AD_STB0- und AD_STB1-Signalpaare (mit 66 MHz) übertragen
8 Bytes pro Takt = theoretische maximale Bandbreite 533 MB/sec.

AGPx4
AGP-Taktsignal (CLK): 66 MHz
Daten werden auf der fallenden Flanke der AD_STB0- und AD_STB1-Signalpaare und der AD_STB0#- und AD_STB1#-Signalpaare (mit 133 MHz) übertragen
16 Bytes pro Takt = theoretische maximale Bandbreite 1067 MB/sec. oder 1,0 GB/sec.


Grob gefasst: AGPx1 überträgt auf der fallenden Flanke eines Signals mit 66 MHz, AGPx2 auf der steigenden und fallenden Flanke eines Signals mit 66 MHz und AGPx4 auf den fallenden Flanken von zwei Signalen mit 133 MHz. Der reine AGP-Takt bleibt in allen Fällen bei 66 MHz - nur die Signalpaare werden bei AGPx4 mit 133 MHz betrieben (die 133 MHz werden aus der Verdoppelung des CLK-Signals generiert). Meßbar bleiben weiterhin nur die 66 MHz - insofern kann man nicht von einem AGP-Takt von 133 MHz sprechen, daß ganze ist auch rein auf einen aktivierten AGPx4-Modus beschränkt (und dieser aktiviert sich im gewöhnlichen nur in Spielen, unter Windows laufen Grafikkarten im Normalfall mit AGPx1).

Hieraus ergibt sich meiner Meinung nach ein sehr wahrscheinlicher Ansatz für Intels AGPx8: Bei AGPx1 wird nur mit einer Flanke übertragen, bei AGPx2 mit zwei Flanken. Bei AGPx4 sind es dann nur wieder eine Flanke - was läge näher, als bei AGPx8 wieder auf beiden Flanken zu übertragen? Das ganze würde dann so ausssehen:

AGPx8 (spekulativ)
AGP-Taktsignal (CLK): 66 MHz
Daten werden auf der steigenden und der fallenden Flanke (spekulativ) der AD_STB0- und AD_STB1-Signalpaare und der AD_STB0#- und AD_STB1#-Signalpaare (mit 133 MHz) übertragen
32 Bytes pro Takt = theoretische maximale Bandbreite 2133 MB/sec. oder 2,1 GB/sec.


Das muß letztendlich natürlich nicht so sein, es gibt auch andere Lösungen. Andererseits - Intel sagt klar etwas von der Abwärtskompatiblität bei AGPx8. Was einer größeren baulichen Änderungen des AGP-Ports und damit auch möglichen weiteren Signalpaaren (mehr als die beschriebenen gibt es nicht, nur noch die SBA-Adresspaare, aber die sind vergeben) einen Riegel vorschiebt. Andere Lösung wäre eine Erhöhung des Takts der Signalpaare auf 266 MHz - unwahrscheinlich, daß bringt nur Wärme-Probleme am AGP-Port und auch an der Grafikkarte selber mit sich. Eine solch hohe Frequenz im Grafikchip sicher zu entkoppeln dürfte auch nicht ganz unproblematisch sein (ergibt auch wieder Wärmeprobleme) - insofern wirklich unwahrscheinlich.

Zugegebenermaßen fällt mir nun nichts weiter als obige Lösung ein - aber auf der technischen Ausführung selbst liegt sicher nicht das primäre Interesse. Da lassen wir uns doch einfach mal überraschen.

Denn die vordringliche Frage sei erlaubt: Was bringt uns AGPx8?

Denn die in vorher skizzierter Lösung aufgezeigte Bandbreite von 2 GB/sec. bestätigt Intel ja schon selber. Und es wäre erst einmal wirklich eine Verdopplung der theoretischen maximalen Bandbreite. Aber die beide Adjektive zum Substantiv lassen es schon erahnen - theoretisch und maximal haben in der Regel wenig mit echtem Leistungszuwachs zu tun. Auf jeden Fall muß man kein AGPx8 in der Praxis gesehen haben, um über Sinn und Unsinn jetzt schon philosophieren zu können.

Um kurz und schmerzlos den Ist-Zustand zu porträtieren: AGPx4 bringt heute - zwei Jahre nach Markteinführung - Geschwindigkeitszuwächse zu AGPx2 von 0,0 bis 0,5 Prozent. Ergo kann man dies ehemalige Key-Feature zumindestens unter den aktuellen Anforderungen vergessen. Auch AGPx8 sollte es auf absehbarer Zeit nicht anders ergehen - sagt die Theorie. In diese Theorie wird sich aber in der Zukunft ein dato noch nicht wesentlich beachteter zukünftiger Flaschenhals einmischen - wenngleich noch niemand sicher sagen kann, wann genau diese Zukunft sein wird.

Denn es werden in ein paar Jahren Spiele mit gigantischen Polygon-Mengen (100.000 Dreiecke pro Szene und mehr) auftauchen (eventuell spielt ja wieder id Software mit "Doom 3" den technologischen Vorreiter). Schon mit der diesjährigen Herbst/Winter-Generation werden diese Anforderungen von den Grafikkarten auch in der Praxis realisierbar sein - und irgendwann werden es die Spiele-Designer auch nutzen. Das ganze läuft auf "Segen und Leid" von T&L in Hardware hinaus - erst mit T&L in den Grafikkarten werden diese Polygon-Mengen auf dem PC möglich - allerdings wird dann die Belastung des AGP-Busses durch Geometriedaten neue, extreme Ausmaße annehmen. Mit den heutigen T&L-Grafikkarten und den heutigen T&L-Spielen wird AGPx2 (533 MB/sec.) und AGPx4 (1067 MB/sec.) noch nicht annähernd ausgenutzt - und daß obwohl die Geometriedaten den Hauptteil der mittels AGP-Bus übertragenene Daten darstellen dürften.

Denn heutige Spiele nutzen um die 10.000 bis 20.000 Polygone pro Sekunde. Quake III Arena verbraucht nach guter Schätzung (20.000 Polygone, 80 Bytes pro Polygon) für die Sendung der Geometriedaten zur T&L-Einheit der Grafikkarte durchschnittlich ca. 140 MB/sec. bei durchschnittlichen 85 fps (Standard-Wert für "com_maxfps"). Noch einmal 30-50 MB/sec. gehen dabei für AGP-Steuersignale drauf und ca. 20 MB/sec. für Texturentransporte (32-MB-Grafikkarte sei Dank). Das sind kummulativ ca. 200 MB/sec., was mit AGPx1 (267 MB/sec.) sicher absolut lösbar ist. In Szenen mit höherer Komplexität kann es zwar schon einmal ein bißchen mehr sein, aber die 533 MB/sec. von AGPx2 benötigt Q3A in keiner Sequenz. Außerdem limitiert in Szenen mit höherer Komplexität in erster Linie die Render-Geschwindigkeit und -Bandbreite der Grafikkarte, ob dann der AGP-Bus genug Geometrie-Daten für 85 fps liefert, ist momentan noch zweitrangig.

Wenn man sich dann aber ein angenommenes Doom 3 mit 150.000 Polygonen pro Sekunde vorstellt (und der sicher noch weiter angestiegene Einsatz von MultiTexturing und Blending-Effekten etc. wird die Anzahl der zu berechnenden und übermittelnden Bytes pro Dreieck sicher weiter anschwellen lassen, ergo möglicherweise 150 Bytes pro Polygon) - dann wären dafür bei nur 40 fps allein 900 MB/sec. AGP-Transferleistung vonnöten. Dafür wäre selbst AGPx4 zu klein - denn Steuerdaten und sicher nicht kleine Texturen wollen genauso übertragen werden. Der entscheidende Punkt: Die T&L-Einheiten der Grafikkarten in zwei Jahren werden dies verarbeiten können, genauso wird wohl die Rendering-Leistung und die Bandbreite dafür vorhanden sein. Aber die Datenmenge muß erst einmal zur Grafikkarte - hier genau liegt der Grund für AGPx8. Nicht für heutige Spiele, nicht für heutige und zukünftige Grafikkarten, allein für zukünftige Spiele mit gigantischer Polygon-Zahl ist AGPx8 interessant.

Daraus ergibt sich auch schon die Erwartungshaltung an die zukünftige Bedeutung: AGPx8 wird nicht vor zwei Jahren interessant werden - auch wenn die entsprechenden Produkte (Mainboards und Grafikkarten) schon viel eher erscheinen werden. Eventuell bastelt Intel dann, wenn AGPx8 erstmals Vorteile bringt, schon wieder an einem neuen Standard oder aber einem vollkommen anderen Port - wer weiss.

Wichtig für jetzt ist, daß AGPx8 auf absehbare Zeit kein echtes Kaufargument sein wird - wenngleich der grundsätzliche Gedanke des Lösens von Bandbreiten-Problemen (schon bevor sie akut werden) sehr lobenswert ist. Trotzdem gilt abzuwarten, was die Zukunft an Software (Spielen) bringen wird - allein diese werden über den Sinn dieser Technik bestimmen. Und eventuell hat ja in zwei Jahren die Geometriedaten-Komprimierung für den Wintel-PC schon Marktreife erlangt ...



Home               News-Archiv August 2000    

Shortcuts
nach oben