Zum 3DCenter Forum
Inhalt




Speicher-Skalierung auf dem Athlon 64

20. Oktober 2005 / von Madkiller & BlackBirdSR / Seite 1 von 3


Es gib viele Faktoren, mit denen man die Leistung des eigenen Systems beeinflussen kann. Die sicherlich offensichtlichste ist die Steigerung des CPU-Takts. Jeder CPU-Käufer weiss, daß sich ein höherer Takt auch in steigender Leistung auszahlt. Eng damit verbunden ist der Speichertakt, welcher dem Benutzer eine weitere Möglichkeit gibt, die Leistung seines Systems zu steigern. Doch während gerade die Taktfrequenz der Prozessoren in den letzten Jahren gleich einer Rakete an Höhe gewonnen hat, stagniert sie bei Speichermodulen schon seit einiger Zeit.

Bis vor kurzem transportierte der Speicherbus Signale noch ausschließlich über den Front-Side-Bus der CPU. Mit Einführung des AMD Athlon 64 hat sich das allerdings geändert. Der Speicherbus bekommt seine ganz eigenen, direkt mit der CPU verbundenen Daten- und Adressleitungen. Bestimmendes Element für den Takt des Speicherbusses und der Speichermodule ist nun der Speicherteiler. Er generiert je nach Wert aus dem vorliegenden CPU-Takt den endgültigen Speichertakt. Eben jene Funktion spielt in diesem Artikel die zentrale Rolle für alle durchgeführten Tests.

Im folgenden versuchen wir festzustellen, wie stark der Athlon 64 auf dem Sockel 939 mit steigendem/fallendem Speichertakt bei identischen Timings skaliert. Auf den Punkt gebracht, positionieren wir dazu einen Athlon 64 mit einem Teiler von "12" und dynamischem CPU-Takt gegen CPUs fixer Taktfrequenzen, aber variablem Teiler und damit Speichertakt. Durch eine mathematische Berechnung aus allen vorliegenden Benchmark-Werten ergibt sich anschließend der CPU-Takt (und damit Speichertakt), der benötigt werden würde, um von der Performance her gleichzuziehen. Eine entsprechende Anzahl an Teilern und Benchmarks erlaubt, eigene Schlüsse zu ziehen und die Tendenz dann für eigene Bedürfnisse anzuwenden.

    Testsystem:
  • AMD Athlon 64 (Winchester-Core, 512 kByte Level2 Cache)
  • Abit AV8 3rd-Eye (VIA K8T800 Pro)
  • Creative Audigy2 (Sound-Details waren auf Maximum mit EAX 5.1)
  • 2x 1024 MB RAM DDR1 auf 200 MHz bei 2.5-3-2-6-1T
  • PowerColor Radeon X800 XT-PE mit 256 MB auf 520/560 MHz
  • Microsoft Windows XP
  • Benchmark-Settings: 1024x768 auf maximalen Details ohne Anti-Aliasing und anisotropen Filter

Der ein oder andere wird vielleicht kurzfristig von den nun folgenden Tabellen erschlagen. In diesem Fall hilft es vielleicht die prinzipielle Vorgehensweise mit Hilfe des eines Beispiels aus dem Benchmark von Battlefield 2 und dort dem ersten und dem letzten Ergebnis der Testreihe 2 einmal kurz durchzugehen.

So erreicht ein 1.8 GHz Athlon 64 mit einem Speichertakt von 150 MHz (Teiler von 12) 71,78 fps unter Battlefield 2. Behält man nun die Taktfrequenz bei und ändert nur das Verhältnis von Speicherteiler und Speichertakt, ergeben sich unter derselben Taktfrequenz abweichende Performance-Resultate: Mit 18x100 sind es nur 62,80 fps, mit 8x225 immerhin 75,52 fps. Aus diesen Benchmark-Resultaten wurde dann mathematisch errechnet, auf welcher Taktfrequenz und bei welchem Speichertakt unsere Test-CPU unter Einsetzung eines 12er Speicherteilers dieselben Resultate erreicht: Die 62,80 fps erreicht der Athlon 64 also bei 12x123 und 1471 MHz CPU-Takt, die 75,52 fps bei 12x178 und 2134 MHz CPU-Takt.

Es lässt sich daher recht einfach erkennen, wie CPUs höherer Taktraten immer schlechter skalieren. Schuld daran sind Wartezeiten. Während die CPU schneller getaktet wird, fällt der Speichertakt immer weiter zurück. Die gewonnene Leistung kann nicht mehr direkt umgesetzt werden. Dieses Problem fällt bei geringen Taktraten viel geringer aus, ergo wird weniger CPU-Takt benötigt.


Battlefield 2
  Testreihe 1 Testreihe 2 Testreihe 3
Speicherteiler 18 71,80 fps @ 2200 MHz (18x122)
rechnerisch 1802 MHz (12x150) benötigt für die gleiche Performance
62,80 fps @ 1800 MHz (18x100)
rechnerisch 1471 MHz (12x123) benötigt für die gleiche Performance
-
Speicherteiler 16 - 66,60 fps @ 1800 MHz (16x113)
rechnerisch 1601 MHz (12x133) benötigt für die gleiche Performance
-
Speicherteiler 14 - 68,98 fps @ 1800 MHz (14x129)
rechnerisch 1692 MHz (12x141) benötigt für die gleiche Performance
-
Speicherteiler 12
(Ausgangswerte)
76,29 fps @ 2400 MHz (12x200)
75,42 fps @ 2100 MHz (12x175)
71,78 fps @ 1800 MHz (12x150)
63,98 fps @ 1500 MHz (12x150)
51,97 fps @ 1200 MHz (12x100)
Speicherteiler 10 75,69 fps @ 2000 MHz (10x200)
rechnerisch 2193 MHz (12x183) benötigt für die gleiche Performance
73,94 fps @ 1800 MHz (10x180)
rechnerisch 1978 MHz (12x165) benötigt für die gleiche Performance
-
Speicherteiler 8 - 75,52 fps @ 1800 MHz (8x225)
rechnerisch 1978 MHz (12x165) benötigt für die gleiche Performance
72,72 fps @ 1600 MHz (8x200)
rechnerisch 1877 MHz (12x156) benötigt für die gleiche Performance
Speicherteiler 6 - - 64,59 fps @ 1200 MHz (6x200)
rechnerisch 1523 MHz (12x127) benötigt für die gleiche Performance



Counter-Strike: Source
  Testreihe 1 Testreihe 2 Testreihe 3
Speicherteiler 18 32,52 fps @ 2200 MHz (18x122)
rechnerisch 1963 MHz (12x164) benötigt für die gleiche Performance
26,50 fps @ 1800 MHz (18x100)
rechnerisch 1601 MHz (12x133) benötigt für die gleiche Performance
-
Speicherteiler 16 - 27,68 fps @ 1800 MHz (16x113)
rechnerisch 1671 MHz (12x139) benötigt für die gleiche Performance
-
Speicherteiler 14 - 28,69 fps @ 1800 MHz (14x129)
rechnerisch 1730 MHz (12x144) benötigt für die gleiche Performance
-
Speicherteiler 12
(Ausgangswerte)
39,52 fps @ 2400 MHz (12x200) 29,89 fps @ 1800 MHz (12x150) 19,65 fps @ 1200 MHz (12x100)
Speicherteiler 10 34,65 fps @ 2000 MHz (10x200)
rechnerisch 2097 MHz (12x175) benötigt für die gleiche Performance
31,11 fps @ 1800 MHz (10x180)
rechnerisch 1876 MHz (12x156) benötigt für die gleiche Performance
-
Speicherteiler 8 - 31,96 fps @ 1800 MHz (8x225)
rechnerisch 1929 MHz (12x161) benötigt für die gleiche Performance
28,60 fps @ 1600 MHz (8x200)
rechnerisch 1724 MHz (12x144) benötigt für die gleiche Performance
Speicherteiler 6 - - 22,01 fps @ 1200 MHz (6x200)
rechnerisch 1338 MHz (12x112) benötigt für die gleiche Performance



Earth 2160
  Testreihe 1 Testreihe 2 Testreihe 3
Speicherteiler 18 21,7 fps @ 2200 MHz (18x122)
rechnerisch 1893 MHz (12x158) benötigt für die gleiche Performance
17,3 fps @ 1800 MHz (18x100)
rechnerisch 1546 MHz (12x129) benötigt für die gleiche Performance
-
Speicherteiler 16 - 18,8 fps @ 1800 MHz (16x113)
rechnerisch 1662 MHz (12x139) benötigt für die gleiche Performance
-
Speicherteiler 14 - 19,6 fps @ 1800 MHz (14x129)
rechnerisch 1723 MHz (12x144) benötigt für die gleiche Performance
-
Speicherteiler 12
(Ausgangswerte)
27,7 fps @ 2400 MHz (12x200) 20,6 fps @ 1800 MHz (12x150) 12,8 fps @ 1200 MHz (12x100)
Speicherteiler 10 24,5 fps @ 2000 MHz (10x200)
rechnerisch 2130 MHz (12x178) benötigt für die gleiche Performance
21,8 fps @ 1800 MHz (10x180)
rechnerisch 1901 MHz (12x158) benötigt für die gleiche Performance
-
Speicherteiler 8 - 22,7 fps @ 1800 MHz (8x225)
rechnerisch 1977 MHz (12x165) benötigt für die gleiche Performance
19,8 fps @ 1600 MHz (8x200)
rechnerisch 1738 MHz (12x145) benötigt für die gleiche Performance
Speicherteiler 6 - - 15,2 fps @ 1200 MHz (6x200)
rechnerisch 1385 MHz (12x115) benötigt für die gleiche Performance







Kommentare, Meinungen, Kritiken können ins Forum geschrieben werden - Registrierung ist nicht notwendig Weiter / Next

Shortcuts
nach oben