Die weltgrößte Linux-Datenbank speichert Klimadaten

Das World Data Center Climate (WDCC) und das Deutsche Klimarechenzentrum (DKRZ) in Hamburg betreiben die größte Datenbank weltweit unter Linux. Das zeigt ein internationales Ranking der weltgrößten Datenbanken, das von der Winter Corporation
veröffentlicht wurde. Die Datenbank des WDCC am DKRZ umfasst 220 Terabyte (!) und ist damit sogar doppelt so groß wie die Datenbank einer bekannten Internet-Suchmaschine.

Das World Data Center Climate (WDCC) des International Council for Science (ICSU) wird betrieben von der Gruppe Modelle und Daten am Max-Planck-Institut für Meteorologie (M&D/MPI-M) und dem Deutschen Klimarechenzentrum (DKRZ). Die Datenbank des WDCC spiegelt den aktuellen Wissensstand der Klimaforschung über Zustand und zu erwartende Änderungen des Klimas. Allein 115 Terabyte wurden für die neuen IPCC-Simulationsdaten für den vierten, für Anfang 2007 geplanten, Bericht des „Zwischenstaatlichen Ausschusses für Klimawandel der Vereinten Nationen“ (Intergovernmental Panel on Climate Change – kurz : IPCC) erzeugt. Das entspricht rund 24.500 DVDs.

NEC installierte das Datenbanksystem vor drei Jahren zusammen mit einem 1,5 Teraflops schnellen NEC Vektorsupercomputer der Serie SX-6 am DKRZ. Der vom Bund mit rund 35 Millionen Euro geförderte Vektorsupercomputer ist der schnellste Supercomputer für die Klimaforschung in Europa. Er führt bis zu 1,5 Billionen Rechenoperationen pro Sekunde aus und speichert die Rechenergebnisse mit bis zu 450 MByte/s auf Festplatten.

Am DKRZ sind Festplatten mit einer Gesamtspeicherkapazität von 100 Terabyte installiert. Darüber hinaus gehender Speicherplatzbedarf wird mit Magnetbändern abgedeckt, die insgesamt mehr als sechs Petabyte fassen. Mehrere schnelle NEC TX7-Datenserver mit Intel Itanium2-Prozessoren übernehmen dabei die Rolle von Protokollanten, die immer wissen, welche Daten wo auf den Festplatten und Bändern gespeichert sind. Die Modellergebnisse sind in einer relationalen Oracle Datenbank gespeichert und stehen Forschern weltweit zur weiteren Auswertung zur Verfügung. Das Gesamtsystem aus Supercomputer und Speicher belegt 750 Quadratmeter im Hamburger Geomatikum.

„Klimaforscher erzeugen mit aufwendigen Simulationsrechnungen riesige Datenmengen. Zur Aufbereitung der Forschungsergebnisse müssen diese Daten jederzeit schnell und effizient zugreifbar sein. Alle Rechnungen bleiben für spätere Vergleiche gespeichert. Daher ist die Datenbank auf sehr großes Datenwachstum bis in den Petabyte Bereich hinein ausgelegt“, erklärte Dr. Michael Lautenschlager von der Gruppe Modelle & Daten des Max-Planck-Instituts.

ZDNet.de Redaktion

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

47 Minuten ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

3 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

4 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

4 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

4 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

5 Tagen ago