Backup: Wie funktioniert das Backup-System?

Antworten
Benutzeravatar
AliG
Moderator
Beiträge: 3727
Registriert: 6. Jun 2007, 17:33
Wohnort: Salzburg, Österreich

Backup: Wie funktioniert das Backup-System?

Beitrag von AliG »

Frage:
Ich hab 4 PCs zu Hause. Wenn ich den gesamten verwendeten Speicherplatz zusammenzähle, komme ich auf etwa 220GB. Die PCs werden alle von Windows Home Server gesichert. Wenn ich in der Home Server Konsole bei Serverspeicher nachschaue, sehe ich, dass nur etwa 98GB Speicherplatz für Backups verbraucht wird. Wie kann das sein?

Antwort:
Im Gegensatz zu anderer Backup-Software die dateibasiert arbeitet, arbeitet das Windows Home Server Backup mit "Cluster". Cluster sind die hardwarenahen Bausteine des Dateisystems. Sie sind auf den meisten NTFS-Festplatten 4KB groß. Das "Wunder" dass du beobachtest, ist das Ergebnis der Tatsache, dass Windows Home Server sicherstellt, dass immer nur jeweils ein gleicher Cluster auf dem Server gespeichert wird, auch wenn dieser Cluster auf mehreren Festplatten in mehreren Dateien vorhanden ist. Diese Technik ist auch bekannt als "Single Instance Store".
Hier sind einige Details, wie es genau funktioniert:
  • Die Server-Seite dieser Lösung ist eine Datenbank (keine Standard-Datenbank, sondern eine die speziell für diese Anwendung entwickelt wurde). Die "Datensätze" in der Datenbank sind Cluster und Hashes dieser Cluster (ein Hash ist eine Nummer die einen Cluster auf Basis seines Inhaltes eindeutig identifiziert). Die Datenbank enthält auch Informationen über die Struktur einer Festplatte (NTFS Dateisysteminformationen). Wenn ein Cluster auf der C: Partition auf dem einen Computer die ersten 4096 Zeichen eines Textes enthält, und ein Cluster auf der E: Partition auf einem anderen PC die selben 4096 Zeichen enthält, dann werden die Hashes die gleichen sein.
  • Wenn ein Computer auf den Server gesichert wird, untersucht der Computer welche Cluster sich seit dem letzten Backup geändert haben
  • Die Software errechnet dann einen Hash für jeden dieser Blöcke und schickt nur den Hash zum Server
  • Der Server sieht in seiner Datenbank nach, ob einer der gespeicherten Hashes mit dem gerade erhaltenen übereinstimmt. Wenn ein Hash übereinstimmt, heißt das, dass der Cluster bereits auf dem Server gespeichert ist.
  • Wenn keine Übereinstimmung gefunden wurde (der Cluster also noch nicht auf dem Server gespeichert ist), sendet der Client den Cluster an den Server und der Server fügt ihn zur Datenbank hinzu.
  • Alle Dateisysteminformationen werden zum Server geschickt und dort gespeichert, so dass jeder Datenträger (von jedem Computer) zu jedem Backupzeitpunkt von der Datenbank rekonstruiert werden kann.
Das ist der Grund, warum 220GB Daten verteilt über 4 Computer in nur 98GB Speicherplatz auf dem Home Server gespeichert werden können.

Quelle: http://forums.microsoft.com/WindowsHome ... &SiteID=50


Eine sehr gute Beschreibung haben auch die Forumsmitglieder in diesem Thread: viewtopic.php?f=33&t=2314 gegeben. Wer das Backup-System verstehen will, sollte sich das auf jeden Fall durchlesen ;)
Mache ich etwas richtig, merkt es keiner. Mache ich etwas falsch, vergisst es keiner. :D

Mein WHS
Antworten