Interview mit ATI´s Eric Demers
6. November 2003 / von Leonidas / Seite 1 von 1
Unser Interviewpartner ist Eric Demers, Hardware Engineering Manager von ATI.
3DCenter: Mit dem kürzlich erschienenen Catalyst 3.8 Treiber führte ATI die dynamische Overclocking-Funktion namens OverDrive ein. Diese funktioniert nur, wenn der Chip über eine Temperaturdiode verfügt. Plant ATI, diese Funktionalität zukünftig in alle Produkte zu integrieren? Ist auch eine Lüftersteuerung geplant, die bei geringer Last die Lautstärke mindert?
Eric Demers: OverDrive ist ein großartiges neues Feature, das wir mit der 9600 XT und der 9800 XT vorgestellt haben. Es erlaubt uns "sicher" zu übertakten, indem die Temperatur des Grafikchips überwacht wird. Mit dieser Information kann der Treiber die Taktfrequenz der GPU und des Speichers anpassen. Die Temperaturinformationen sind jedoch nicht ausreichend, um die "wahren" Grenzen eines einzelnen Chips zu kennen (wir müssten auch die exakten Prozessinformationen über diesen Chip wissen). Aufgrund dieser Voraussetzung muss OverDrive ein wenig gemäßigt werden (so könnten Übertakter immer noch höhere Resultate erreichen, würden aber damit ihre Ansprüche auf Garantie verlieren). Wir haben also die Technologie um OverDrive in zukünftigen Produkten zu implementieren, wenn wir einen Bedarf danach sehen. Tatsächlich benutzen unsere aktuellen Mobillösungen PowerPlay in ähnlicher Weise, um die Taktfrequenz zu senken, wenn die Grafiklast niedrig ist. Ich kann nicht spezifisch sagen, welche zukünftigen Produkte OverDrive enthalten werden, aber überprüft, ob OverDrive unterstützt wird, wenn wir ein neues Produkt vorstellen!
Die 9800 XTs unterstützen bereits eine variablen Lüfterdrehzahl und passen sie der jeweiligen Temperatur an. Wir müssen dabei vorsichtig sein, um einen leisen Betrieb zu gewährleisten. Wir wollen nicht, dass unser Lüfter zum Laubgebläse wird, wenn Sie eine 3D-Anwendung starten! Und was einen völlig leisen Betrieb betrifft, so muss auch im 2D-Betrieb etwas Wärme abgeführt werden. Es gibt verschiedene Kühllösungen, die zumindest in 2D einen leisen Betrieb ermöglichen würden (ich benutze einen Zalman auf meiner 9700 Pro). Unsere AIBs (und mindestens einer hat sie bereits benutzt) sind ebenso wie ATI dazu aufgerufen, diese zu untersuchen.
3DCenter: In den letzten Jahren ging bei den Desktop-Chips der Trend immer mehr hin zu höherer Leistungsaufnahme der Karten, was sich auch beispielsweise in Stromanschlüssen und aufwändigen Kühllösungen auf den Karten niederschlägt. Im Mobil-Bereich wird dagegen auf weit sparsamere Technologie gesetzt. Zieht ATI auch die Produktion besonders sparsamer Chips für den Desktop-Markt in Betracht?
Eric Demers: Im mobilen Sektor wird es immer aufwändiger, die Leistungsaufnahme niedrig zu halten und gleichzeitig die Gesamtleistung zu erhöhen. Dies ist wahrscheinlich die wichtigste Zielsetzung des Mobilmarktes. Der Trend bei der Leistungsaufnahme von Desktop-Grafikkarten (zumindest bei High-End Systemen) deutet im Moment nach oben. Die Mittelklasse war ein bisschen zurückhaltender, und eine 9600 non-Pro wird mit passiver Kühlung ausgeliefert. Die Steigerung der Leistungaufnahme kommt durch den Einsatz größerer Dies mit höheren Taktfrequenzen.
Im allgemeinen sinkt mit kleineren Prozessen (150nm, 130nm und jetzt 90nm) die benötigte Leistung pro Transistor (kleinere Transistoren und Spannungen führen zu geringerem Leistungsbedarf bei einem Schaltvorgang). Da sich unsere Transitorzahlen jedoch mit einer größeren Rate erhöht haben, stieg der aktive Leistungsbedarf weiter an. Aber mit 130nm, und noch mehr mit 90nm, steigt der statische Leistungsbedarf immer weiter an. Bei einem normalem CMOS-Prozess könnte man denken, dass ein Transistor, der nicht schaltet, keine Energie benötigt. Das ist ungefähr richtig, aber es gibt da etwas, das "Leckstrom" genannt wird. Dabei handelt es sich um einen kleinen Strom, der selbst dann aus einem Transistor abgeleitet wird, wenn er nicht schaltet. Mit schrumpfenden Dimensionen sind die Leckströme bei jedem Schritt um etwa eine Größenordnung gestiegen. Dies führt zu dem Problem, dass die Leistungsaufnahme für das "Nicht-Schalten" immer größer wird. Mit 90nm wird es mehr als die Hälfte der Gesamtleistung sein. Diese Leistung ist direkt proportional zur Anzahl der aktiven Tranistoren, oder einfach gesagt zur Größe des Dies. Folglich sinkt der aktive Leistungsbedarf mit kleinerem Prozess, aber der passive Leistungsbedarf nimmt zu. Mit 90nm wird die Leistungsaufnahme zu einem großen Thema, selbst wenn der Chip nichts macht.
Angesichts des Gesagten kann selbst die Leistungsaufnahme von High-End Desktop-Chips ihre Leistungsaufnahme nicht unbegrenzt wachsen. Demzufolge forschen wir nach Energiesparmöglichkeiten, um den Verbrauch von Desktop-Grafikkarten zu senken. Sowohl die Mobil-Technologien als auch andere werden dabei betrachtet. Aber wir wollen die Desktop-Chips aus Sicht der Performance nicht einschränken. Dies ist ein schmaler Grat, dem wir uns sehr wohl bewusst sind.
3DCenter: Die aktuellen MacOS X Treiber von ATI bieten die Möglichkeit, Supersampling auf R3x0-Karten zu aktivieren. Wird man diese Option auch bald in den Windows-Treibern finden?
Eric Demers: Es ist eine Möglichkeit, aber momentan nicht geplant. Die Erfordernisse für die Treiberunterstützung dieses Features sind unter Windows enorm, was es nicht gerade ansprechend macht. Ausserdem könnte ein Supersampling-Algorithmus mit unserer momentan angebotenen Anti-Aliasing Qualität nicht mithalten, da er keine Gammakorrektur bieten würde, wie es unser momentaner Anti-Aliasing Algorithmus kann. Der einzige Vorteil von Supersampling würde bei Alpha-Test Texturen liegen. Dies erscheint uns momentan nicht wie ein lohnender Tausch.
3DCenter: Mit der zunehmenden Verwendung komplexer Pixel Shader steigt auch die Gefahr dass Aliasing auftritt. Wird es die Aufgabe der Entwickler sein, dies durch den klugen Einsatz geeigneter Mittel (z.B. die DDX/DDY-Instruktionen) zu vermeiden, oder wird ATI die Entwickler mit neuen Möglichkeiten unterstützen?
Eric Demers: Unser MSAA-Algoritmus arbeitet momentan perfekt mit Shadern zusammen, da wir sowohl Center Sampling als auch Centroid Sampling pro Textur anbieten, um einige Shader-Artefakte zu vermeiden. Was Aliasing prozeduraler Texturen betrifft, kann es unter bestimmten Umständen ein Problem sein, wenn eine prozedurale Textur zuviele hochfrequente Bestandteile besitzt. Es gibt einige Dinge, die Entwickler tun können um Artefakte zu verringern. Dazu gehört z.B. in eine hochauflösende Textur zu rendern und diese mit einem Tiefpassfilter zu bearbeiten, bevor sie benutzt wird. Entwickler könnten auch einfach Texturen erzeugen, die nicht so viele hochfrequente Bestandteile besitzen. In der aktuellen Spielegeneration hat sich dies noch nicht als Problem herausgestellt. Für die Zukunft kann ich mir vorstellen, dass es ein größeres Thema werden könnte. Und wir werden unsere Entwickler mit einer Menge neuer Features unterstützen (wie z.B. Centroid Sampling), und das normalerweise sogar bevor sie benötigt werden. Im Endeffekt liegt es bei den Entwicklern zu entscheiden, wie ihre Spiele aussehen sollen.
3DCenter: Die Radeon 9800 Karten brachten ein neues Feature, den F-Buffer. Ist dies nur eine Zwischenlösung, oder wird dies auch in Zukunft der Weg sein mit dem ATI die Herausforderungen langer, dynamischer Shader angehen will.
Eric Demers: Das F-Buffer Konzept ist eine Methode, um Multi-Pass zu verallgemeinern und tatsächlich nutzbar zu machen. Und man braucht Multi-Pass Lösungen, um mit sehr langen Shadern und anderen Anforderungen wie z.B. größerem temporärem Speicher oder einer größeren Anzahl an Iteratoren usw. umgehen zu können (Anmerkung Redaktion: Iteratoren oder hier auch Interpolatoren sind die Einheiten, die für die Generierung der Eingangswerte für den Pixel Shader zuständig sind, die über ein Polygon interpoliert werden, beispielsweise also Texturkoordinaten). Es ist allerdings kein Wundermittel, das grenzenlose Shader erlaubt. Wir planen, den F-Buffer durch eine OpenGL Extension dem erfahrenen Entwickler zur Verfügung zu stellen. Wir arbeiten daran, die einfache Nutzung für unsere zukünftigen Produkte zu verbessern. Wir betrachten auch andere Lösungen, die es den Entwicklern vereinfachen, beispielsweise lange Shader zu schreiben. Ich bin sicher, dass zukünftige Produkte diese Features ebenso besitzen werden.
3DCenter: Mit dem 6x Multisampling der R3x0-Karten hat ATI einen neuen Standard für Antialiasing-Qualität gesetzt. Sehen Sie eine Notwendigkeit für eine weitere Steigerung auf diesem Gebiet in nächster Zeit (beispielsweise 8x oder 10x-Modi)?
Eric Demers: Es gibt immer noch keine einzige PC-Grafikkarte, die solch eine Anti-Aliasing Qualität bietet, wie wir es tun. Wir haben nicht nur ein programmierbares Muster (das momentan als "sparse" realisiert ist), wir sind auch die einzige Firma, die gammakorrigiertes Anti-Aliasing anbietet, was einen deutlichen Qualitätsanstieg bedeutet. Ehrlich, wir haben die besten 8x und sogar "16x" Samplinglösungen im kommerziellem PC-Markt angeschaut und niemand erreicht auch nur annähernd unsere Qualität. Aber wir suchen immer nach Verbesserungsmöglichkeiten. Etwas, das man dabei nicht außer Acht lassen darf ist, dass bei der Verwendung eines verlustfreien Algorithmus, wie wir es tun (verlustbehaftete können die Qualität nur senken), ein sehr hoher Speicherbedarf durch den Backbuffer entstehen kann. Bei 1600x1200 mit 6xAA benötigt unser Buffer über 100 MB des lokalen Speicherplatzes. Eine Erhöhung auf 8xAA hätte einen Bedarf von über 128MB ergeben. Folglich müssen mehr Subpixel bei einem verlustlosen Algorithmus entweder durch Änderungen des Algorithmus oder durch einen größeren lokalen Speicher ausgeglichen werden. Wir erforschten Sachen wie zufällige Änderungen des programmierbaren Musters, aber das dadurch bedingte niederfrequente Rauschen war schlimmer als die Verbesserungen in der Anordnung der Subpixel. Bevor man nicht zwischen 32 und 64 Subpixel hat, ist die Einführung zufälliger Variationen keine gute Idee. Deshalb forschen wir nach anderen Lösungen und Algorithmen. Momentane und zukünftige Benutzer werden mit unseren Lösungen glücklich sein. Bleibt dran.
3DCenter: Der Parhelia-Chip von Matrox bietet Unterstützung für "Surround-Gaming". Denken Sie, dass dies eher eine Spielerei ist, oder wird dies in einigen Jahren die übliche Form des Spielens sein? Wie bewerten sie Alternativen, die den Spieler mehr in das Geschehen eintauchen lassen, wie z.B. 3D-Brillen.
Eric Demers: Ich kann bei dieser Sache nicht wirklich für ATI sprechen. Unsere Produkte könnten in Zukunft diese Features unterstützen, wenn die Firma sie als sinnvoll und rentabel erachtet. Meiner Meinung nach klingt "Surround Gaming" cool, aber es ist normalerweise praktisch nicht nutzbar, so dass es ein Nischenfeature oder Gimmick bleiben wird. Ich denke wirklich nicht, dass es ein Verkaufsargument sein wird. Ausserdem erhöht es die Verpackungs- und Board-Kosten, so dass jeder Benutzer für dieses Feature zahlen muss, was nicht gerade toll ist. Andere Technologien wie 3D-Brillen oder 3D LCD-Bildschirme, die es erlauben tiefer ins Geschehen einzutauchen, haben ihre Berechtigung. Früher bei SGI habe ich 3D-Brillen an High-End Systemen benutzt und sie waren cool und haben gut funktioniert. Die erschwinglichen Brillen, die ich vor nicht allzu langer Zeit benutzt habe, hinterließen einen eher mäßigen Eindruck, da der 3D-Effekt nicht immer da ist und die niedrige Framerate (auf die Hälfte reduziert) viel vom "Eintaucheffekt" wegnimmt. Ich hoffe, dass sich diese Technologie weiterentwickelt, denn diese Art von Erfahrung ist großartig wenn sie funktioniert.
Wir danken Eric Demers für das interessante Gespräch und seine ausführlichen Antworten.