Windows Server 8: die Möglichkeiten der Daten-Deduplizierung

Viele der neuen Funktionen in Windows Server 8 werden Serveradministratoren unmittelbare Vorteile bieten. Eine dieser Funktionen, die jüngst auf dem Windows Server 8 Reviewers Workshop vorgestellt wurde, ist eine Deduplizierungsengine, die für NTFS-Volumes aktiviert werden kann. Deduplizierung kann auf verschiedene Weise umgesetzt werden, und bei der Implementierung in Windows Server 8 handelt es sich um eine Post-Process-Deduplizierung, die pro Volume aktiviert wird und mittels PowerShell ausgeführt werden kann.

Die grundlegende Funktionsweise der Windows-Deduplizierung beruht auf variablen Blöcken mit einer Größe von 32 KByte bis 128 KByte. Redundante Blöcke werden in einen Blockspeicher kopiert, den Windows verwaltet und im System Volume Information-Abschnitt der Festplatte aufbewahrt. Das heißt, der innere Mechanismus der Deduplizierungsengine ist von außen nicht zu erkennen.
Die folgende Abbildung zeigt, wie die Windows-Deduplizierung auf zwei Dateien angewendet wird.


In der Abbildung sind die Datenblöcke A, B und C Kandidaten für die Deduplizierung. Wenn die Deduplizierungsengine ausgeführt wird, werden die redundanten Blöcke einer zu deduplizierenden Datei in den Blockspeicher kopiert. Von hier aus hat die Datei zwei Dimensionen ihrer Daten: einen Spare- und einen Reparse-Bereich. Die Reparse-Bereiche zeigen für den Zugriff auf die gemeinsamen Blöcke oder deduplizierten Daten auf den Chunk-Store.

Die Deduplizierungsprozesse werden als geplante Windows-Aufgaben ausgeführt oder können interaktiv über die PowerShell gestartet werden. Mit dem Befehl Get-DedupStatus kann man schnell den Deduplizierungsanteil auf einem einzelnen Volume anzeigen. Diese geplanten Aufgaben suchen das Volume nach Deduplizierungskandidaten ab und koordinieren dann das Verschieben in den Chunk-Store. Die Datendeduplizierung von Windows Server 8 darf nicht auf C:-Laufwerken ausgeführt werden. Microsoft-Produktmanager gaben als Grund dafür an, dass die Systemperformance hoch gehalten werden solle. Dies erklärt sich dadurch, dass jede Deduplizierungsengine einen Mehraufwand bedeutet, ganz gleich, was die Anbieter dazu sagen.

Erfahrungen mit dem Deduplizierungsprozess für Windows:

  • Wenn eine Datei vollständig dedupliziert ist, verbraucht sie nur 4 KByte auf der Festplatte. Diese werden nur für die Metadatenabschnitte der Dateien benötigt, und alle Reparse- (und nicht Parse-) Bereiche befinden sich dann im Blockspeicher.
  • Wenn man eine Datei im Windows Explorer anklickt (auch eine Datei auf einem nicht deduplizierten Volume), können die Werte für die Dateigröße und die Größe auf dem Datenträger ein neues Verhalten aufweisen. Diese beiden Werte zeigen dann die Größe der vollständigen Datei und den deduplizierten Platzverbrauch (außerhalb des Blockspeichers).
ZDNet.de Redaktion

Recent Posts

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

7 Stunden ago

Hacker missbrauchen Google Calendar zum Angriff auf Postfächer

Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…

1 Tag ago

Bedrohungen in Europa: Schwachstellen in der Lieferkette dominieren

Hinter 84 Prozent der Zwischenfälle bei Herstellern stecken Schwachstellen in der Lieferkette. Auf dem Vormarsch…

2 Tagen ago

Bericht: Apple arbeitet an faltbarem iPad

Es kommt angeblich 2028 auf den Markt. Das aufgeklappte Gerät soll die Displayfläche von zwei…

2 Tagen ago

HPE baut Supercomputer am Leibniz-Rechenzentrum

Das System basiert auf Hardware von HPE-Cray und Nvidia. Die Inbetriebnahme erfolgt 2027.

3 Tagen ago

Bund meldet Fortschritte in der Netzversorgung

Die Bundesnetzagentur hat ihr Gigabit-Grundbuch aktualisiert. Drei von vier Haushalten sollen jetzt Zugang zu Breitbandanschlüssen…

3 Tagen ago