Windows Server 8: die Möglichkeiten der Daten-Deduplizierung

Daten-Deduplizierung mit Windows Server 8 bietet Speicherplatzeinsparung für Windows-Server mit NTFS-Laufwerken. ZDNet hat sich diese Funktion genauer angesehen.

Viele der neuen Funktionen in Windows Server 8 werden Serveradministratoren unmittelbare Vorteile bieten. Eine dieser Funktionen, die jüngst auf dem Windows Server 8 Reviewers Workshop vorgestellt wurde, ist eine Deduplizierungsengine, die für NTFS-Volumes aktiviert werden kann. Deduplizierung kann auf verschiedene Weise umgesetzt werden, und bei der Implementierung in Windows Server 8 handelt es sich um eine Post-Process-Deduplizierung, die pro Volume aktiviert wird und mittels PowerShell ausgeführt werden kann.

Die grundlegende Funktionsweise der Windows-Deduplizierung beruht auf variablen Blöcken mit einer Größe von 32 KByte bis 128 KByte. Redundante Blöcke werden in einen Blockspeicher kopiert, den Windows verwaltet und im System Volume Information-Abschnitt der Festplatte aufbewahrt. Das heißt, der innere Mechanismus der Deduplizierungsengine ist von außen nicht zu erkennen.
Die folgende Abbildung zeigt, wie die Windows-Deduplizierung auf zwei Dateien angewendet wird.

In der Abbildung sind die Datenblöcke A, B und C Kandidaten für die Deduplizierung. Wenn die Deduplizierungsengine ausgeführt wird, werden die redundanten Blöcke einer zu deduplizierenden Datei in den Blockspeicher kopiert. Von hier aus hat die Datei zwei Dimensionen ihrer Daten: einen Spare- und einen Reparse-Bereich. Die Reparse-Bereiche zeigen für den Zugriff auf die gemeinsamen Blöcke oder deduplizierten Daten auf den Chunk-Store.
In der Abbildung sind die Datenblöcke A, B und C Kandidaten für die Deduplizierung. Wenn die Deduplizierungsengine ausgeführt wird, werden die redundanten Blöcke einer zu deduplizierenden Datei in den Blockspeicher kopiert. Von hier aus hat die Datei zwei Dimensionen ihrer Daten: einen Spare- und einen Reparse-Bereich. Die Reparse-Bereiche zeigen für den Zugriff auf die gemeinsamen Blöcke oder deduplizierten Daten auf den Chunk-Store.

Die Deduplizierungsprozesse werden als geplante Windows-Aufgaben ausgeführt oder können interaktiv über die PowerShell gestartet werden. Mit dem Befehl Get-DedupStatus kann man schnell den Deduplizierungsanteil auf einem einzelnen Volume anzeigen. Diese geplanten Aufgaben suchen das Volume nach Deduplizierungskandidaten ab und koordinieren dann das Verschieben in den Chunk-Store. Die Datendeduplizierung von Windows Server 8 darf nicht auf C:-Laufwerken ausgeführt werden. Microsoft-Produktmanager gaben als Grund dafür an, dass die Systemperformance hoch gehalten werden solle. Dies erklärt sich dadurch, dass jede Deduplizierungsengine einen Mehraufwand bedeutet, ganz gleich, was die Anbieter dazu sagen.

Erfahrungen mit dem Deduplizierungsprozess für Windows:

  • Wenn eine Datei vollständig dedupliziert ist, verbraucht sie nur 4 KByte auf der Festplatte. Diese werden nur für die Metadatenabschnitte der Dateien benötigt, und alle Reparse- (und nicht Parse-) Bereiche befinden sich dann im Blockspeicher.
  • Wenn man eine Datei im Windows Explorer anklickt (auch eine Datei auf einem nicht deduplizierten Volume), können die Werte für die Dateigröße und die Größe auf dem Datenträger ein neues Verhalten aufweisen. Diese beiden Werte zeigen dann die Größe der vollständigen Datei und den deduplizierten Platzverbrauch (außerhalb des Blockspeichers).

Neueste Kommentare 

Noch keine Kommentare zu Windows Server 8: die Möglichkeiten der Daten-Deduplizierung

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *