Das DHSI muss herhalten, wenn Daten zwischen den bis zu vier physikalischen CPUs ausgetauscht werden. Dabei fällt zum einen die FSB-Geschwindigkeit von nur 1066 MHz auf. Chipsätze für 2P-Systeme schaffen bis zu 1600 MHz. Zum anderen stellt sich bei bis zu 24 Kernen die Frage nach einem effizienten Cache-Kohärenz-Protokoll.
Über den FSB mit 1066 MHz wird man sich in der Praxis wenig ärgern müssen, denn der Bottleneck liegt im Speichercontroller. Der Caneland-Chipsatz verfügt nur über einen einzigen Quad-Channel-FB-DIMM-Memory-Controller, der zudem nur Module mit einem effektiven Takt von 533 MHz und 667 MHz unterstützt. Mittlerweile sind am Markt 800 MHz üblich. Mehr als 20 GByte/s lässt sich damit nicht erreichen. Sind alle 24 Cores mit speicherintensiven Aufgaben betraut, dann tut sich hier ein gewaltiger Flaschenhals auf.
Für die Cache-Kohärenz hat sich Intel etwas besonderes einfallen lassen: den so genannten Snoop Filter. Das ist ein 64 MByte großer SRAM auf dem Chipsatz mit Tabelleneinträgen für jede Cache-Line. So kann jeder Core schnell nachschauen, ob ein anderer Core eine Cache-Line im Zugriff hat. Ein Broadcast-Protokoll mit einer Anfrage an jeden anderen Core entfällt.
Demgegenüber steht jedoch der Nachteil, dass der Snoop Filter nur dann funktionieren kann, wenn jeder Core jeden Cache-Zugriff im Snoop Filter dokumentiert, unabhängig davon, ob ein anderer Core die jeweilige Speicheradresse benötigt oder nicht. So kann je nach Anwendungsfall ein Performancevorteil entstehen, aber auch ein Performancenachteil.
Im Praxistest von ZDNet muss ein Testrechner beweisen, dass er hält, was Intel verspricht. Der Testrechner ist mit vier X7460-CPUs ausgestattet, die je über sechs Cores, 2,66 GHz Taktfrequenz und 16 MByte Level-3-Cache verfügen. Als Vergleich dient ein Mac Pro mit zwei Xeon-E5462-Prozessoren und 2,8 GHz Taktfrequenz.
Um eine bessere Vergleichbarkeit zu gewährleisten, ersetzt ZDNet die 800-MHz-RAM-Module im Mac Pro durch Bausteine mit 667 MHz, die wegen des DRAM:FSB-Verhältnisses von 4:5 nur mit 640 MHz laufen. Der Vergleich soll vor allem dazu dienen, herauszufinden, unter welchen Bedingungen ein Server mit 24 Cores tatsächlich so viel mehr leistet als ein 2P-System auf Basis der Xeon-5000-Architektur, dass sich ein Betrieb lohnt.
Das Dunnington-System zieht bereits im Idle-Betrieb 502 Watt Leistung. Bei Volllast zeigt das Wattmessgerät stolze 748 Watt an. Im Vergleich dazu kommt der Mac Pro auf 140 Watt im Idle-Betrieb und auf 265 Watt bei Volllast.
Neueste Kommentare
Noch keine Kommentare zu Hexa-Core auf x86-Basis: Intel Dunnington im Test
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.