Windows Server 8: die Möglichkeiten der Daten-Deduplizierung

Viele der neuen Funktionen in Windows Server 8 werden Serveradministratoren unmittelbare Vorteile bieten. Eine dieser Funktionen, die jüngst auf dem Windows Server 8 Reviewers Workshop vorgestellt wurde, ist eine Deduplizierungsengine, die für NTFS-Volumes aktiviert werden kann. Deduplizierung kann auf verschiedene Weise umgesetzt werden, und bei der Implementierung in Windows Server 8 handelt es sich um eine Post-Process-Deduplizierung, die pro Volume aktiviert wird und mittels PowerShell ausgeführt werden kann.

Die grundlegende Funktionsweise der Windows-Deduplizierung beruht auf variablen Blöcken mit einer Größe von 32 KByte bis 128 KByte. Redundante Blöcke werden in einen Blockspeicher kopiert, den Windows verwaltet und im System Volume Information-Abschnitt der Festplatte aufbewahrt. Das heißt, der innere Mechanismus der Deduplizierungsengine ist von außen nicht zu erkennen.
Die folgende Abbildung zeigt, wie die Windows-Deduplizierung auf zwei Dateien angewendet wird.


In der Abbildung sind die Datenblöcke A, B und C Kandidaten für die Deduplizierung. Wenn die Deduplizierungsengine ausgeführt wird, werden die redundanten Blöcke einer zu deduplizierenden Datei in den Blockspeicher kopiert. Von hier aus hat die Datei zwei Dimensionen ihrer Daten: einen Spare- und einen Reparse-Bereich. Die Reparse-Bereiche zeigen für den Zugriff auf die gemeinsamen Blöcke oder deduplizierten Daten auf den Chunk-Store.

Die Deduplizierungsprozesse werden als geplante Windows-Aufgaben ausgeführt oder können interaktiv über die PowerShell gestartet werden. Mit dem Befehl Get-DedupStatus kann man schnell den Deduplizierungsanteil auf einem einzelnen Volume anzeigen. Diese geplanten Aufgaben suchen das Volume nach Deduplizierungskandidaten ab und koordinieren dann das Verschieben in den Chunk-Store. Die Datendeduplizierung von Windows Server 8 darf nicht auf C:-Laufwerken ausgeführt werden. Microsoft-Produktmanager gaben als Grund dafür an, dass die Systemperformance hoch gehalten werden solle. Dies erklärt sich dadurch, dass jede Deduplizierungsengine einen Mehraufwand bedeutet, ganz gleich, was die Anbieter dazu sagen.

Erfahrungen mit dem Deduplizierungsprozess für Windows:

  • Wenn eine Datei vollständig dedupliziert ist, verbraucht sie nur 4 KByte auf der Festplatte. Diese werden nur für die Metadatenabschnitte der Dateien benötigt, und alle Reparse- (und nicht Parse-) Bereiche befinden sich dann im Blockspeicher.
  • Wenn man eine Datei im Windows Explorer anklickt (auch eine Datei auf einem nicht deduplizierten Volume), können die Werte für die Dateigröße und die Größe auf dem Datenträger ein neues Verhalten aufweisen. Diese beiden Werte zeigen dann die Größe der vollständigen Datei und den deduplizierten Platzverbrauch (außerhalb des Blockspeichers).
ZDNet.de Redaktion

Recent Posts

Die Probleme der beliebtesten Sportart: Wird Fußball langweilig?

Fußball ist in Europa die unangefochtene Nummer 1, wenn es um Sport geht. Millionen von…

10 Minuten ago

Weltweiter Smartphonemarkt wächst 7,8 Prozent im ersten Quartal

Die Marktforscher von IDC sehen Samsung in einer stärkeren Position als in den vergangenen Quartalen.…

21 Stunden ago

Top-Malware in Deutschland: Remcos überholt CloudEye

Der Remote Access Trojan nutzt eine neue Verbreitungstechnik. Der auf Windows ausgerichtete Downloader CloudEye behauptet…

2 Tagen ago

Erste öffentliche Beta von Android 15 verfügbar

Google bietet die Vorabversion derzeit exklusiv für bestimmte Pixel-Geräte an. Zu den neuen Funktionen gehört…

4 Tagen ago

Apple warnt vor Spyware-Angriffen auf iPhones

Sie sind zielgerichtet und betreffen aktuell Nutzer in 92 Ländern weltweit. Bei den Angriffen kommt…

4 Tagen ago

Deutsche zeigen Mobile Banking die kalte Schulter

Mit ihren Dienstleistungen für Smartphones stoßen viele Banken eher auf Desinteresse. Eine Umfrage von Sopra…

4 Tagen ago