Zum 3DCenter Forum
Inhalt




Speicher-Skalierung auf dem Athlon 64

20. Oktober 2005 / von Madkiller & BlackBirdSR / Seite 3 von 3


Neben den bisherigen Ergebnissen lässt sich auch noch etwas weiteres ableiten. Im Grunde völlig logisch, wurde es bisher jedoch kaum wirklich betrachtet: Die vielgerühmte Pro/MHz-Leistung eines Prozessors ist nicht konstant.

Im Allgemeinen scheint die Pro/MHz-Leistung für Viele eher eine Konstante innerhalb der CPU-Architektur zu sein. Wie die Benchmarks in diesem Artikel zeigen, ist dies jedoch nicht der Fall. Die Pro/MHz-Leistung eines Prozessors fällt mit steigender Taktrate. Im Detail sieht das folgendermaßen aus:


Speicherteiler bei 2400 MHz Speicherbandbreite Pro/MHz-Leistung
6er (6x400) 200% 118%
7er (7x343) 171% ca. 115,2%
8er (8x300) 150% 112,3%
9er (9x267) 133% ca. 109,5%
10er (10x240) 120% 106,7%
11er (11x218) 109% ca. 103,4%
12er (12x200) 100% 100%
13er (13x185) 92% ca. 97,5%
14er (14x171) 86% 94,9%
15er (15x160) 80% ca. 92,7%
16er (16x150) 75% 90,4%
17er (17x141) 71% ca. 87,7%
18er (18x133) 67% 84,9%


Besonders "wohl" fühlt sich dabei der Athlon 64 Prozessor bei Teilern zwischen 14 und 10. Über 15 machen sich Verluste durch den geringen Speichertakt oft schmerzlich bemerkbar. Teiler unter 10 wird man relativ selten finden, verlangt dieser bei höhergetakten CPUs doch 250 MHz und mehr für den Speicher. Darüber hinaus, wird der Athlon 64 bei einem 10er Teiler wohl schon relativ effektiv ausgelastet, da er von einem niedrigeren Teiler nicht mehr so stark profitieren kann.

Im Detail nochmal verglichen bedeutet dies:

  • Vom 18er auf 16er Speicherteiler sind es 12,5% mehr Bandbreite/geringere Latenzen und eine um 6,5% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 52% mit.

  • Vom 16er auf 14er Speicherteiler sind es 14,3% mehr Bandbreite/geringere Latenzen und eine um 5,0% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 35% mit.

  • Vom 14er auf 12er Speicherteiler sind es 16,7% mehr Bandbreite/geringere Latenzen und eine um 5,4% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 32% mit.

  • Vom 12er auf 10er Speicherteiler sind es 20,0% mehr Bandbreite/geringere Latenzen und eine um 6,7% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 33% mit.

  • Vom 10er auf 8er Speicherteiler sind es 25,0% mehr Bandbreite/geringere Latenzen und eine um 5,2% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 21% mit.

  • Vom 8er auf 6er Speicherteiler sind es 33,3% mehr Bandbreite/geringere Latenzen und eine um 5,1% höhere Pro/MHz-Leistung. Die Pro/MHz-Leistung skaliert also zu der höheren Bandbreite/geringere Latenzen um 15% mit.

Als Basis diente immer ein 2.4 GHz Athlon 64 mit einem Teiler von 12. Ändert man den Teiler auf einen Wert von 10, so ergibt sich ein Leistungsplus von ca 6,7%. Die theoretische Bandbreite, welche der CPU zur Verfügung steht, verändert sich um 20%. Wird der Teiler auf einen Wert von 14 gesetzt, verringert sich die theoretische Bandbreite auf 86% des ursprünglichen Werts, die resultierende Pro/MHz-Leistung der CPU sinkt dabei auf 94,9% ab. Das lässt sich nun für alle Modelle durchlaufen.

Die Pro/MHz-Leistung einer Architektur mag gegenüber einer anderen nun höher oder niedriger sein, zwischen den unterschiedlichen getakteten CPUs einer Familie ist sie aber nicht konstant. Ein 2 GHz Athlon64 besitzt eine höhere Pro/MHz-Leistung als ein schnelleres 2.4 GHz Modell.

Die Gründe dafür sind schnell erläutert: Zwischen dem CPU und Speichertakt klafft eine große Lücke. Typischerweise arbeitet der Speicher mit 200 MHz, während die CPU bereits bei 2 GHz oder mehr ihre Arbeit verrichtet. Jeder Zugriff auf den Speicher bringt also unweigerlich eine gewisse Wartezeit mit sich, weil der Speicher schließlich viel langsamer als die CPU arbeitet - es ergibt sich eine Latenz zwischen Speicheranfrage und dem Erhalt der angeforderten Daten. Je länger die CPU warten muss, desto mehr Rechenleistung geht verloren.

Mit steigendem CPU Takt verschiebt sich nun das Verhältnis zwischen Speicher- und CPU-Takt. Ein 2.4 GHz Model hätte in der verlorenen Zeit ca 20% mehr Arbeit verrichten können als das 2 GHz Modell. Infolge dessen beträgt die Gesamtleistung des 2.4 GHz Systems nicht 20% mehr wie es der Takt verspricht, sondern vielleicht nur 10-15% - die Pro/MHz-Leistung ist faktisch gesunken. Man spricht hier von einem abfallenden Skalierungsverhalten, ganz im Gegensatz zum ersten Teil des Artikels, bei dem der veränderte Speichertakt einem so starken Abfall entgegengewirkt hat.

Eine kurze Anmerkung:
Die obige Tabelle berücksichtigt nur den Unterschied in Takt und Bandbreite. In Wirklichkeit gibt die Latenz wesentlich mehr Aufschluss über die Leistung als die völlig theoretische Bandbreite. Mit steigendem Speichertakt sinkt die Latenz und damit die Wartezeit für die CPU. Allerdings ist es wohl wesentlich einfacher, sich das Modell anhand der Bandbreiten zu veranschaulichen. Für die veränderliche Pro/MHz-Leistung ist im wesentlichen eine Kombination aus der Zugriffslatenz und der realen Speicherbandbreite, welche eine Funktion ersterer ist, verantwortlich.

Abschließend noch ein Direktvergleich aus den erworbenen Erkenntnissen: Wie schnell die jeweiligen CPUs getaktet sein müssten, um jeweils gleich schnell mit unterschiedlichen Speicherteilern zu sein, wobei immer die CPUs in einer Zeile gleich schnell sind. Die Messwerte in diesem Artikel erlauben es, die Performance von schnelleren CPUs, als derzeit tatsächlich erhältlich, relativ gesichert abzuleiten.


200 MHz RAM 15er Teiler 14er Teiler 12er Teiler 11er Teiler 10er Teiler 9er Teiler
1200 MHz 1527 MHz 1492 MHz 1416 MHz 1367 MHz 1327 MHz 1293 MHz
1400 MHz 1739 MHz 1699 MHz 1612 MHz 1559 MHz 1512 MHz 1472 MHz
1600 MHz 1935 MHz 1890 MHz 1794 MHz 1735 MHz 1681 MHz 1638 MHz
1800 MHz 2126 MHz 2077 MHz 1971 MHz 1906 MHz 1847 MHz 1800 MHz
2000 MHz 2301 MHz 2248 MHz 2133 MHz 2063 MHz 2000 MHz 1948 MHz
2200 MHz 2454 MHz 2397 MHz 2275 MHz 2200 MHz 2132 MHz 2078 MHz
2400 MHz 2589 MHz 2529 MHz 2400 MHz 2321 MHz 2249 MHz 2192 MHz
2600 MHz 2735 MHz 2671 MHz 2535 MHz 2452 MHz 2376 MHz 2315 MHz
2800 MHz 2866 MHz 2800 MHz 2657 MHz 2570 MHz 2490 MHz 2426 MHz
3000 MHz 3000 MHz 2930 MHz 2781 MHz 2690 MHz 2606 MHz 2540 MHz
3200 MHz 3121 MHz 2048 MHz 2893 MHz 2798 MHz 2711 MHz 2642 MHz
3400 MHz 3217 MHz 3142 MHz 2982 MHz 2884 MHz 2795 MHz 2723 MHz
3600 MHz 3297 MHz 3220 MHz 3056 MHz 2956 MHz 2864 MHz 2791 MHz







Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Zurück / Back 3DCenter-Artikel - Index Home

Shortcuts
nach oben