Deduplizierung: Funktionsweise und Einsatzszenarien

Grundsätzlich unterscheidet man zwischen drei Arten der Deduplizierung: Client-, Media-Server- sowie Appliance-Deduplizierung. Bei der Client-Deduplizierung ist bereits das zu sichernde System für die Deduplizierung verantwortlich: Daten werden dabei bereits an der Quelle dedupliziert und dem Media Server in „bereinigter“ Form übergeben.

Die Deduplizierungs-Lösung wird in diesem Fall auf dem Applikationsserver installiert. Zu den Vorteilen dieser Form der Deduplizierung zählen reduzierter Netzwerkverkehr, da lediglich die deduplizierten Informationen übertragen werden, und die erhöhte Geschwindigkeit der Backups. Darüber hinaus kommt die Client-Deduplizierung der Skalierbarkeit zugute, weil die Prozessorlast auf alle Clients verteilt wird. Der Media Server kann daher mehr Backups gleichzeitig verarbeiten.

Allerdings belastet der Prozess die Ressourcen des Applikationsservers. Die Client-seitige Deduplizierung eignet sich in erster Linie für Unternehmen, deren Applikationsserver über genügend CPU- und Speicher verfügen und die mit minimalen Datenänderungen rechnen beziehungsweise mit einer virtualisierten Serverumgebung arbeiten. Diese Form der Deduplizierung hat den Vorteil, dass keine Performance-Verluste aufgrund von Übermittlungen über WAN-Strecken entstehen.

Deduplizierung am Media Server

Bei der Deduplizierung am Media Server hingegen werden die Informationen dedupliziert, sobald sie beim Media Server – also dem für das Backup verantwortlichen Rechner – ankommen. Hier ist die Deduplizierung in der Backup-Software auf dem Media Server enthalten. Das Prinzip: Der Backup-Agent auf dem Applikationsserver sendet die zu sichernden Daten an den Media Server, der die neuen und veränderten Blocks auf den angebundenen Speichermedien ablegt.

Die Vorteile dieser Konstellation sind, dass existierende Backup-Software auf den Clients weiterhin verwendet werden kann und Agenten auf dem Applikationsserver unter Umständen nicht verändert werden müssen. Die Media-Server-Deduplizierung eignet sich für Unternehmen, die Daten auf jedem auf dem Markt verfügbaren Disk-Storage-Systemen sichern möchten. Zudem lässt sich die Media-Server-Deduplizierung perfekt in Linux- und Solaris-Umgebungen integrieren und kann VMware-ESX-Umgebungen sowie vSphere-basierte Clouds zur Sicherung nutzen.

Deduplizierung auf dem Media Server eignet sich vor allem in Umgebungen, in denen die Rechenleistung der Client-Systeme für wichtigere Aufgaben verwendet werden soll. Nicht ratsam ist diese Form der Deduplizierung aufgrund des Datenaufkommens hingegen, wenn Zweigniederlassungen via WAN-Strecken an die Zentrale angebunden sind und Clients in den Außenstellen gesichert werden sollen. Ebenso wie bei der Client-Deduplizierung ist auch hier ein Einsparpotenzial von 60, sogar bis über 90 Prozent des Storage möglich.

Deduplizierung per Appliance

Daneben hat sich eine dritte Form entwickelt: die Deduplizierung mit speziellen Appliances. Ein dediziertes Deduplizierungs-Device übernimmt dabei sämtliche Aufgaben des Deduplizierungs-Prozesses. Einige dieser Appliances bieten eine integrierte Replikationsfähigkeit. Die Appliance-basierte Deduplizierung von Symantec etwa nutzt eine OpenStorage-Technologie in Verbindung mit einer Third-Party-Deduplizierungs-Appliance und einem Open-Storage-Plugin des Herstellers. Die offensichtlichsten Vorzüge: Performance-Vorteile gegenüber dem Network File System (NFS) und dem Common Interface File System (CIFS) sowie die Entlastung der Clients und der Media Server vom Deduplizierungsprozess.

Deduplizierung und Virtualisierung

Für den Einsatz in virtualisierten IT-Umgebungen sollten entsprechende Deduplizierungs-Lösungen über die Möglichkeit verfügen, granulare Wiederherstellungen in einem einzigen Single-Pass-Backup zu ermöglichen. Damit sind Unternehmen in der Lage, Ausfallzeiten von Geschäftsanwendungen zu verkürzen, indem einzelne Daten aus dem Backup eines kompletten Systems extrahiert werden. Zu den zu unterstützenden Umgebungen gehören dabei in der Regel VMware vSphere 4.0 und 4.1, oder Microsoft Hyper-V R2. Damit sind Administratoren in der Lage, auf den virtuellen Plattformen ganze Applikationen, Daten und Ordner schnell und einfach wiederherzustellen.

Fazit

Unabhängig von der Art der Deduplizierung bleibt das Resultat gleich: Speicher lässt sich optimieren, indem Informationsfragmente lediglich einmalig auf dem entsprechenden Speichermedium gesichert werden. Im Zusammenhang mit kontinuierlich wachsenden Datenbergen ist es lediglich eine Frage der Zeit, wann und in welcher Form Deduplizierungs-Technologien zum Einsatz kommen. Wichtig dabei ist, die passende Form der Deduplizierung zu finden und zusätzlich eine Lösung für das Versions-Tracking von Dateien zu erwägen.

AUTOR

Andreas Bechter ...

... ist Regional Product Manager EMEA der Information Management Group von Symantec. Das Unternehmen bietet Lösung zur Archivierung, Datensicherung für Rechenzentren, Datensicherung und Wiederherstellung für Windows-Server sowie Komplettlösung für Backup und Recovery an, in denen Deduplizierungstechnologien integriert sind.

Themenseiten: Gastbeiträge, IT-Business, Mittelstand, Storage, Symantec

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

1 Kommentar zu Deduplizierung: Funktionsweise und Einsatzszenarien

Kommentar hinzufügen

Kommentare sind bei diesem Artikel deaktiviert.