Bulldozer auf dem Server: AMDs neue Opteron-CPUs

AMD stellt heute neue Server-Prozessoren auf Basis seiner Bulldozer-Architektur vor. Nachdem der Chipdesigner vor einem Monat Bulldozer-CPUs für Desktop-Systeme gezeigt hat, folgen jetzt die Modelle für Pizzaboxen im Rechenzentrum.

Dabei bringt AMD zwei verschiedene Modellreihen auf den Markt: Die Reihe 4200 (Codename Valencia) ist den Desktop-Modellen recht ähnlich. Sie haben jedoch drei Hypertransport-3.0-Kanäle und sind somit für 2P-Systeme geeignet.

Zudem kommt das Spitzenmodell für Server mit 95 Watt TDP aus, während die schnellsten Desktop-CPUs 125 Watt benötigen. Dafür taktet das Serverspitzenmodell nur mit 3,0 GHz (Turbo bis 3,7 GHz), während die Desktop-Variante bis 3,6 GHz (Turbo bis 4,2 GHz) hochgezüchtet wurde.

Die Reihe 6200 (Codename Interlagos) ist quasi eine Verdopplung der Reihe 4200. Statt zwei DDR3-1600-Speicherkanälen gibt es vier und der gemeinsame L3-Cache beträgt 16 MByte statt 8 MByte. Ferner gibt es vier Hypertransport-3.0-Kanäle, so dass bis zu vier Interlagos-CPUs auf einem Motherboard kombiniert werden können.

Bulldozer-CPUs werden aus sogenannten Modulen aufgebaut. Jedes Modul besteht aus zwei Integer-Kernen, die aber ein gemeinsames Instruction-Fetching und -Decoding besitzen und sich vor allem eine Floating-Point-Unit teilen müssen. Bei bisherigen AMD-CPUs und allen aktuellen Intel-Prozessoren gehört zu jedem Integer-Kern auch eine eigene Floating-Point-Unit. Durch das gemeinsame Instruction-Decoding arbeiten die zwei Integer-Kerne auch nicht zu 100 Prozent unabhängig voneinander.

Für AMDs Marketingabteilung ist die Sache klar: Ein Bulldozer-Modul hat zwei Cores, denn ein 16-Kerner verkauft sich besser als ein Achtkerner. Kritiker wenden jedoch ein, dass es sich bestenfalls um eine Art "Hyperthreading Deluxe" handelt. Die Wahrheit liegt irgendwo dazwischen.

Die folgenden beiden Tabellen geben eine Übersicht über alle seit heute verfügbaren Modelle.

Übersicht über AMD-Interlagos-CPUs mit Bulldozer-Kernen

Modell Takt (GHz) Max. Turbo (GHz) TDP (W) Threads/
Integer-
Cores/
FPUs
L2-Cache (MByte) L3-Cache (MByte) Speicher-kanäle Preis (Dollar)
6282 SE 2,6 3,3 140 16/16/8 16 16 4x DDR3 1600 1019
6276 2,3 3,2 115 16/16/8 16 16 4x DDR3 1600 788
6274 2,2 3,1 115 16/16/8 16 16 4x DDR3 1600 639
6272 2,1 3,0 115 16/16/8 16 16 4x DDR3 1600 523
6238 2,6 3,2 115 12/12/6 12 16 4x DDR3 1600 455
6234 2,4 3,0 115 12/12/6 12 16 4x DDR3 1600 377
6220 3,0 3,6 115 8/8/4 8 16 4x DDR3 1600 523
6212 2,6 3,2 115 8/8/4 8 16 4x DDR3 1600 266
6204 3,3 115 4/4/2 4 16 4x DDR3 1600 455
6262 HE 1,6 2,1 85 16/16/8 16 16 4x DDR3 1600 523

Übersicht über AMD-Valencia-CPUs mit Bulldozer-Kernen

Modell Takt (GHz) Max. Turbo (GHz) TDP (W) Threads/
Integer-
Cores/
FPUs
L2-Cache (MByte) L3-Cache (MByte) Speicher-kanäle Preis (Dollar)
4284 3,0 3,7 95 8/8/4 8 8 2x DDR3 1600 316
4280 2,8 3,5 95 8/8/4 8 8 2x DDR3 1600 255
4238 3,3 3,7 95 6/6/3 6 8 2x DDR3 1600 255
4234 3,1 3,5 95 6/6/3 6 8 2x DDR3 1600 174
4226 2,7 3,1 95 6/6/3 6 8 2x DDR3 1600 125
4274 HE 2,5 3,5 65 8/8/4 8 8 2x DDR3 1600 377
4228 HE 2,8 3,6 65 6/6/3 6 8 2x DDR3 1600 255
4256 EE 1,6 2,8 35 8/8/4 8 8 2x DDR3 1600 377

Kompatibilitätsprobleme mit älteren Betriebssystemen

Man kann darüber streiten, ob ein Bulldozer-Modul als Dual-Core bezeichnet werden darf. Fakt bleibt aber, dass die Bulldozer-Architektur eine Neuheit im x86-Markt darstellt. Das heißt, dass im Hardware Abstraction Layer der Betriebssysteme Anpassungen vorgenommen werden müssen.

Das ist im Serverbereich sehr ärgerlich, denn in den Rechenzentren wird mitnichten nur das neueste Betriebssystem mit aktuellem Patchstand verwendet. Der Betrieb von Legacy-Software auf älteren Betriebssystemen wie Windows Server 2003, RHEL 5.x oder SLES 10 ist der Normallfall.


Die Liste der inkompatiblen Betriebssysteme ist lang (Grafik: AMD).

Doch die Liste der Betriebssysteme beziehungsweise Hypervisor, die auf Bulldozer-CPU erst gar nicht hochfahren oder deren Betrieb vom Hersteller nicht empfohlen wird, ist lang:

  • Windows Server vor 2003 R2 SP2
  • Suse Linux Enterprise Server 10 vor SP4
  • Suse Linux Enterprise Server 11 vor SP1
  • Red Hat Enterprise Linux vor 6.1 (außer 5.6 mit Patch, was aber von Red Hat nicht unterstützt wird, Version 5.7 wird voll unterstützt)
  • Alle Linux Vanilla Kernel vor 2.6.32
  • VMWare ESX/vSphere bis einschließlich Version 4.1u1
  • Solaris bis einschließlich 10u8

Für viele IT-Abteilungen und Rechenzentren wird bei dieser Aufzählung der Betrieb von Bulldozer-basierten Systemen vorerst nicht in Frage kommen. Wer beispielsweise eine private Cloud in seinem Intranet aufbaut, weiß im Zweifel gar nicht, welche Betriebssysteme seine internen Kunden in den virtuellen Instanzen hochfahren. Er wird sich hüten, auf eine Hardwareplattform zu setzen, die weniger als 2 Jahre alte Betriebssysteme nicht unterstützt.

Durchsatz statt Rechenleistung

Auf dem Desktop können Bulldozer-CPU gegen Intels Sandy-Bridge-Modelle nicht überzeugen. Sie schneiden in Benchmarks meist schlechter ab und brauchen erheblich mehr Strom. Für bestimmte Serveraufgaben sind Bulldozer-CPUs hingegen geradezu ideal.

Wenn ein Client beispielsweise ein JPEG-Bild anzeigt, dann muss er viele Floating-Point-Operationen durchführen. Hier ist Bulldozer schwach, da sich zwei Integer-Kerne eine Fließkommaeinheit teilen müssen. Ein Server geht mit einem JPEG-Bild jedoch ganz anders um. Er dekodiert es nicht, sondern übergibt es als Web-, File- oder Mail-Server einem Client. Für den Server ist es nur eine Datei, die von A nach B verschoben werden muss.

Genau hier haben die Bulldozer-Server-CPUs ihre Stärke und können weit nach oben skalieren. Ein 4P-System mit 62xx-CPU verfügt insgesamt über 16 DDR3-1600-Speicherkanäle. Das würde theoretisch ausreichen, um jede Sekunde mehr als 200 GByte Daten im Hauptspeicher zu verschieben.

Bei einem typischen Web-, Mail- oder File-Server ist der Verzicht auf Floating-Point-Units zugunsten von mehr Cores und Cache sicherlich ideal. Wer aber Business-Intelligence-Aufgaben mit seinen Servern lösen oder einen Compute-Cluster aufbauen möchte, der wird eher auf CPUs mit einer FPU pro Integer-Core setzen. Eine Ausnahme sind möglicherweise Compute-Cluster mit GPU-Karten wie Nvidia-Tesla. Wenn die Floating-Point-Leistung ohnehin nicht von der CPU erbracht wird, benötigt man weniger FPUs.

Leistung

ZDNet steht noch kein Testgerät zur Verfügung, aber es gibt einige wenige von AMD durchgeführte Benchmarks. Hersteller neigen allerdings dazu, nur solche Ergebnisse zu veröffentlichen, bei denen sie besonders gut abschneiden.

Beim SPECint_rate2006 erzielte ein Supermicro A+ 1022-URF ausgestattet mit zwei CPUs des Spitzenmodells 6282 SE 526 Punkte. Ein Dell Poweredge mit zwei Xeon-X5690-Prozessoren kann hingegen nur 419 Punkte erreichen, obwohl der Xeon-Prozessor etwa 600 Dollar mehr kostet.

Vergleicht man zwei AMD 6220-CPUs (523 Dollar und 115 Watt TDP pro Stück) mit zwei Xeon-E5640-Prozessoren (774 Dollar und 80 Watt TDP pro Stück), so kann AMD 317 Punkte erzielen, während Intel nur 253 erreicht.

Auch beim SPECfp_rate2006-Benchmark kann AMD punkten. Zwei 6276 (788 Dollar / 115 Watt) schlagen zwei Xeon-X5670-CPUs (1440 Dollar / 95 Watt) mit 360 zu 263 Punkten. Beim Linpack mit denselben CPUs erreicht AMD 239,1 FLOP/s und Intel nur 130,1 FLOP/s.

Derzeit können AMDs Bulldozer-CPUs Intels aktuelle Xeon-56xx-CPUs auf Westmere-Basis durchaus schlagen. Zudem bietet Intel nur drei DDR3-Speicherkanäle, während AMD mit vier aufwarten kann. Dass AMD Intel derzeit auch bei Floating-Point-Benchmarks schlagen kann, liegt vor allem daran, dass die Bulldozer-CPUs bereits den 256-Bit-SIMD-Befehlssatz AVX sowie Fused-Multiply-Add besitzen, was Intels Westmere-CPUs noch nicht können.

Allerdings dürften noch dieses Jahr die Karten neu gemischt werden. Gerüchteweise sollen noch vor dem Jahreswechsel die Nachfolger der Xeon-56xx-CPUs erscheinen. Sie basieren auf bis zu acht Sandy-Bridge-Kernen, verfügen über bis zu 20 MByte L3-Cache und haben ebenfalls vier DDR3-Speicherkanäle – jedenfalls, wenn die Gerüchte stimmen. Sie sollen den Namen Xeon-E5-26xx tragen und bis zu 2000 Dollar kosten. Dann werden auch Intel-Server-CPUs AVX beinhalten und obwohl sie kein Fused-Multiply-Add beherrschen, werden sie mit AMD vermutlich mindestens mithalten können.

Fazit

Wer einen Server braucht, bei dem es auf Datendurchsatz ankommt und nicht auf Rechenleistung, der sollte über ein Gerät mit Bulldozer-basierter CPU nachdenken. Mehr Cache und mehr Integer-Cores auf Kosten von Floating-Point-Units ist ein ideales Konzept für typische Web, File- oder Mail-Server.

Bei allen Bulldozer-basierten Rechnern, egal ob Server oder Client, muss bedacht werden, dass nur neuere Betriebssysteme darauf laufen. Einige OS, die nicht einmal zwei Jahre alt sind, können nicht mit Interlagos- oder Valencia-CPUs betrieben werden.

Ferner kann man argumentieren, dass Intels kommende Xeon-E5-26xx-CPUs vermutlich denselben Datendurchsatz wie die heute vorgestellten Bulldozer-CPUs erreichen werden, aber deutlich schneller rechnen können. Hier muss man aber Preis und Performance analysieren.

ZDNet.de Redaktion

Recent Posts

Kaspersky-Prognose: Raffiniertere Deepfakes und mehr Abo-Betrug

Die zunehmende KI-Verbreitung erschwere die Erkennung von Fälschungen. Gleichzeitig begünstige der Abo-Trend das Aufkommen neuer…

3 Stunden ago

Infineon und Quantinuum schließen Entwicklungspartnerschaft

Gemeinsam arbeiten die Konzerne an Ionenfallen, die in Hochleistungs-Quantencomputern zum Einsatz kommen sollen.

8 Stunden ago

Forschende beheben SIEM-Defizite mit ML-Lösung

Neu entwickeltes Open-Source-System soll Signatur-Umgehungen durch adaptive Missbrauchserkennung transparent machen.

9 Stunden ago

Google stopft vier Sicherheitslöcher in Chrome 131

Von mindestens einer Schwachstelle geht ein hohes Sicherheitsrisiko aus. Betroffen sind Chrome für Windows, macOS…

12 Stunden ago

Bitcoin-Trading für Einsteiger und Profis mit Kraken

Digitale Währungen haben in nur kurzer Zeit die komplette Finanzlandschaft auf den Kopf gestellt. Mit…

13 Stunden ago

Dezember-Patchday: Google stopft schwerwiegende Löcher in Android

Mindestens eine Anfälligkeit erlaubt eine Remotecodeausführung. Angreifbar sind alle unterstützten Versionen von Android.

1 Tag ago