Zum 3DCenter Forum
Inhalt




3Dlabs "P10" Preview

5. Mai 2002 / von Leonidas / Seite 3 von 3


Nachfolgend wollen wir noch in loser Folge auf einige weitere interessante Punkte zum P10-Chip eingehen:

Das Design ist komplett skalierbar. Der momentane P10-Chip besteht aus 16 Vertex-, 128 Texturing- und 64 Pixel-Prozessoren. Für 3Dlabs ist es aber kein Problem, auf dieser Basis weitere Chips zu konstruieren, welche mehr oder weniger dieser einzelnen SIMD-Prozessoren tragen. Damit kann 3Dlabs zum einen ohne extra Designs auf unterschiedliche Märkte reagieren und hat zum anderen das Prinzip-Design für dem P10 nachfolgende Chips schon in der Tasche.

Der Chip beherrscht MultiThreading, sprich kann einzelne Aufgaben in Threads unabhängig voneinander bearbeiten. Für diese Möglichkeit eignet sich natürlich ein Grafikchip, wo eigentlich nie neu zu berechnende Aufgaben von den Ergebnissen der noch in der Berechnung befindlichen Aufgaben abhängen, mehr als jede CPU. Genutzt werden kann diese Fähigkeit zum einen zur besseren Ausnutzung der vorhandenen Ressoucen - und zur Parallelberechnung komplett unabhängiger 2D/3D-Berechnungen, ohne daß die eine Anwendung die andere blockiert.

Ein einfaches Beispiel wäre eine Simultan-Beschleunigung von zwei im Fenster laufenden Hardware-beschleunigten 2D/3D-Applikationen (Videos, Spiele). Selbst wenn diese beiden Anwendungen die Hardware überhaupt nicht ausnutzen - zwei Applikationen gleichzeitig würden sich bei derzeitigen Grafikchips gegenseitig komplett behindern. Genauso wie beim MultiProzessoring oder beim MultiThreading bei CPUs kann der P10 diesen Effekt unterbinden. Dies ist insbesondere für den Windows XP Nachfolger mit Codenamen "Longhorn" interessant, basiert dessen Oberfläche doch komplett auf DirectX9, womit der Anwender selbst auf einem normalen Desktop immer eine ganze Reihe unabhängiger DirectX-Anwendungen gleichzeitig laufen hat.

Der P10 ist kein Tiler bzw. nutzt keine Tile-based Rendering-Architektur wie die KYRO-Chips. Daß in vorstehendem Blockdiagramm zu sehende Piktogramm eines "Tile-Prozessors" sagt nur aus, daß der P10 in Tiles ("Kacheln") in den Speicher schreibt, was sehr viele Grafikchips aus Gründen der besseren Ausnutzung der Busbreite so handhaben und damit Speicherbandbreite sparen.

Hochinteresant ist auch das Feature des eigenen Speicher-Controllers, genannt Virtual Memory System (VMS), mit welchem bis zu 16 GB virtueller Speicher angesprochen werden kann. In dem Sinne fungiert der OnBoard-Speicher eines P10-Grafikboards dabei "nur" noch als großer Level2-Cache :-). Der Vorteil liegt weniger darin, 16 GB an Texturen auslagern zu können, sondern darin, durch die direkte Adressierung der ausgelagerten Texturen nur noch diese Teile nachladen zu müssen, welche wirklich im konkreten Fall benötigt werden.

3Dlabs P10 Virtual Memory System

Sprich: Wird von einer 1024x1024 Textur nur ein kleiner Ausschnitt á 40x60 benötigt, wird auch nur dieser Teil nachgeladen - und nicht die komplette Datei, welche ca. 3 MB groß ist. Insbesondere bei der Verwendung von vielen großen Texturen wird sich dieses Feature deutlich bemerkbar machen und dem P10 einen großen Vorteil gegenüber den bisherigen Chips geben, welche immer alle Texturen in voller Schönheit bzw. Größe in den Grafikkarten-Speicher laden müssen. Diese können zwar technisch gesehen mit so großen Texturen umgehen, würden jedoch bei massivem Einsatz deren arge Performance-Probleme bekommen. So macht es auch Sinn, daß der P10 Texturen bis zu 8192x8192 Pixeln Auflösung unterstützt.

Der Vertex Shader des P10 umfaßt 16 einzelne Vertex-Prozessoren gegenüber den 2 Vertex Prozessoren der GeForce4 Ti und dem einem der GeForce3 bzw. der Radeon 8500. Die Roh-Power des P10 Vertex Shaders liegt aber nicht 8x höher als bei der GeForce4 Ti, da diese im Idealfall in beiden Vertex Shaderen in einem Takt jeweils vier Datenpakete mit der gleichen Instruktion bearbeiten kann und damit im Idealfall einen Output von 8 bearbeiteten Datenpaketen hat.

Der Vertex Shader des P10 hat dagegen einen Output von 16 - und ist damit im schlechtesten Fall mindestens doppelt so leistungsfähig wie der Vertex Shader der GeForce4 Ti und viermal so leistungsfähig wie die Vertex Shader der GeForce3 und der Radeon 8500. Sein Vorteil liegt aber vor allem darin, daß er seine volle Leistungsfähigkeit auch dann ausspielen kann, wenn die Datenpakete und Instruktionen völlig ungeordnet ankommen, während die Chips von ATi & nVidia in diesem Fall in ihrer Leistung bis um den Faktor 4 einbrechen können.

Über seine Programmierbarkeit kann der P10 nahezu jede beliebige Art von Anti-Aliasing unterstützen. Dies muß nur der Treiber-Programmier hinbiegen - technisch gesehen wären auch die ausgefallensten AA-Arten kein Thema. Im genauen spricht 3Dlabs hier folgende Möglichkeiten an: OpenGL Edge-AA mit bis zu 16 Samples, ein Accumulation Buffer mit unlimitierten Samples, SuperSampling AA mit ebenfalls unlimitierten Samples und MultiSampling AA mit bis zu 8 Samples. Die Sample-Positionen sind hier wohl vollkommen frei programmierbar.

Von den Filtermöglichkeiten her unterstützt der P10 von Haus aus (bilineares) MIP-Mapping sowie trilineares, anisotropes Filtern und bi-cubisches Filtern. Zusätzliche Filter-Arten sind jederzeit mittels der freien Programmierbarkeit hinzufügbar.

Ein weiteres Feature, bei wessem Anblick John Carmack wieder vor Freude aus dem Fenster hüpfen wird :-), ist die Beschränkung bezüglich der Rendering-Genauigkeit: Der Chip beherrscht nicht nur 64-Bit-Rendering, die Rendering-Genauigkeit ist praktisch unlimitiert.

Weniger gut ist, daß der P10 ganz streng genommen "nur" ein DirectX 8.1 Chip ist, da eine Teilforderung von DirectX9 nicht erfüllt wird: Es fehlen die Gleitkomma-Texurenformate (hat direkt nichts mit der Rendering-Genauigkeit zu tun). Dies werten wir allerdings eher einmal als den technischen Bereich von DirectX9. Rein von den darstellbaren Effekten ist der P10 wie zuvor schon ausgeführt weit vor DirectX9.

Das reine Ausgabeformat des DAC (Digital Analog Converter = die letzte Stufe vor der Ausgabe auf den Monitor) beträgt des P10 beträgt 10:10:10:2 Bits (10 Bits für Rot, Grün, Blau, 2 Bits für den Alpha-Kanal), womit man zwar den Alpha-Kanal um 6 Bits erleichert (was dieser verschmerzen kann), dafür aber die Farben-Darstellung um jeweils 2 Bits verbessert, was zu einer besseren Darstellungsqualität aufgrund von mehr möglichen Farbabstufungen führt.


3DLabs verfügt derzeit schon über ein auf 1/3 des Zieltaktes laufendes A1-Silizium, ein A2-Silizium wird dieser Tage erwartet. Der fertige Chip soll dann im 3. Quartal präsentiert werden, um im 4. Quartal schließlich in die Massenfertigung zu gehen (bei TSMC, wie auch die Chips von nVidia) und noch vor Weihnachten 2002 erhältlich zu sein. 3Dlabs wird wie schon im Zuge der Übernahme durch Creative angekündigt, diesesmal nicht nur Produkte und Treiber für den professionellen Markt, sondern auch für den Gamer-Markt anbieten, sprich: Es wird voll funktionsfähige DirectX- und OpenGL-Treiber geben.

Dann wird sich zeigen, wie schnell der P10 in der Praxis ist. Auf der Habenseite stehen für derzeitige Anwendungen vor allem das 256bittige DDR-RAM Speicherinterface, welches einen Performance-Vorteil gegenüber den derzeitigen Chips ATi & nVidia von ca. 30 bis 50 Prozent verheißt, wenn der 3Dlabs-Treiber optimiert und ausgereift ist. Hier wird die Zukunft zeigen müssen, ob ATi´s R300 und nVidia´s NV30 ebenfalls so viel schneller gegenüber den jetzigen Chips sein werden können. Momentan steht dieses noch etwas zu bezweifeln, da die Leistungssprünge der beiden Chipgiganten in der Vergangenheit selten so groß ausfielen.

Heutige Spiele sind nun einmal zu großen Teilen Bandbreiten-limitiert, unter dem Einsatz der immer stärker zum Zuge kommenden Features anisotrope Filterung und Anti-Aliasing sogar vollständig Bandbreiten-limitiert. Insofern exzellente Vorzeichen für den 3Dlabs-Chips, welcher - sollten nicht ATi & nVidia noch im Herbst mit ebenfalls 256bittigen Speicherinterfaces kontern - die derzeitigen Marktführer erst einmal ganz konventionell schlagen wird: Bei der Performance.

Aber abseits dieser reinen Performance wartet erst die echte Revolution: Denn der 3Dlabs-Chip läutet - insofern er sich durchsetzen kann - eine neue Ära unter den 3D-Beschleunigern ein. Der Grafikchip wird komplett frei programmierbar, so daß es in Zukunft keine Frage mehr sein wird, welche Effekte ein Grafikchip beherrscht, sondern nur noch, wie schnell er diese bewältigen kann. 3Dlabs gebührt hier die Ehre, derjenige zu sein, welcher diese Revolution angestoßen hat - mal schauen, was ATi & nVidia hierzu sagen und wann diese Platzhirsche nachziehen werden.

Bleibt noch ein Merkmal des P10-Chips übrig: Der Preis. Bislang war hierzu noch gar nichts in Erfahrung zu bringen, wir können uns aber sehr gut vorstellen, daß dieser anfänglich nicht gerade niedrig angesiedelt werden dürfte. 76 Millionen in 0.15 micron gefertige Transistoren und ein 256bittiges Speicherinterface lassen den Chip unserer Meinung nach derzeit als einen klaren Kandidat für das über-500-€uro-Segment erscheinen, möglicherweise auch noch ein ganzes Stück mehr.

Die Herbst-Chips von ATi & nVidia werden sich wahrscheinlich unterhalb dieser 500 €uro bewegen, so daß wohl Platz für alle sein wird. Mit Sicherheit wird es ein höchst spannender Grafikchip-Herbst - besonders, da hier aller Wahrscheinlichkeit noch Matrox NextGen-Chip "Parhelia" und mit Glück auch der KYRO III von PowerVR hinzustoßen werden. 3Dlabs hat zumindestens erst einmal vorgelegt und dabei die Meßlatte mehr als hoch angesetzt - jetzt müssen die anderen nachziehen.






Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back 3DCenter-Artikel - Index Home

Shortcuts
nach oben