• Das passende Festplattensystem - Informationen zum Aufbau eines Raid Systems

    Raid / Backup

    Raid beschreibt einen Verbund von Festplatten zu verschiedenen Zielsetzungen.

    In Hochleistungs-Videoschnitt oder CAD-Workstations kommen mitunter Raid-0 Arrays zum Einsatz. Hier werden die Daten häppchenweise auf beide Platten gesplittet. Diesen Leistungsschub erkauft man sich mit einem verdoppelten Ausfallrisiko, bei Defekt einer Platte sind alle Daten verloren. Raid-0 hat auf einem NAS grundsätzlich nichts verloren.
    Raid-1 ist ein Spiegel der Daten auf zwei (oder mitunter auch 3) Platten. Man verliert zwar die Hälfte der Gesamtkapazität, da hier aber keine großen Rechenoperationen nötig sind bietet sich ein Spiegel für leistungsschwache Rechner an, durch die simple Spiegelung kann man die Daten der verbliebenen Platte zumeist auch einzeln auslesen. Spiegel/Mirror sind sehr gut geeignet für Anwendungen wo es auf schnelle Zugriffe ankommt, Datenbankanwendungen beispelsweise.
    Bei Verwendung von zwei 3TB Platten hat man eine Netto Kapazität von 3TB.

    Raid-5 splittet Daten auf >= 3 Platten auf, inclusive Paritätsinformationen aus denen die Daten der ausgefallenen Platte wieder rekonstruiert werden können. Es geht die Kapazitätt einer Platte verloren, und es darf maximal eine Platte ausfallen. Wenn während des Rebuild eine zweite Platte ausfällt, dann sind die Daten verloren.
    Raid-5 bietet ein gutes Kosten/Nutzen Verhältnis und bietet sich als Speicherpool große Datenmengen wie der heimischen Videosammlung an.
    Bei Verwendung von drei 3TB Platten hat man eine Netto Kapazität von 6TB.

    Raid-6 splittet Daten auf >= 4 Platten auf, inklusive Paritätsinformationen aus denen die Daten der ausgefallenen Platte wieder rekonstruiert werden können. Es geht die Kapazitätt von zwei Platten verloren, und es dürfen maximal zwei Platten ausfallen.
    Raid-6 bietet ein schlechteres Kosten/Nutzen Verhältnis als Raid-5, macht aber Sinn bei größeren Arrays, wo durch die lange Rebuild Zeit die Gefahr eines weiteren Plattenverlustes gegeben ist.
    Bei Verwendung von vier 3TB Platten hat man eine Netto Kapazität von 6TB. Bei 4 Platten machen je nach System auch zwei Spiegel mehr Sinn.


    Raid vs Backup

    Raid vs Backup ist kein Vergleich der sich stellt. Ein Raid Array schützt vor dem Ausfall einer oder mehrerer Platten, nicht jedoch vor Verlust bei Diebstahl, Totalverlust durch ein defektes Netzteil oder aber dem Wüten eines virenverseuchten Clients.

    Ein Backup ist immer Pflicht, was, wie oft und auf welche Datenträger hängt von der Art und Wichtigkeit der Daten ab. Die DVD-Rip Sammlung ist, wenn auch mit hohem Zeitaufwand, einfach wieder zu beschaffen, die Hochzeitsbilder von denen es keine Papierabzüge gibt sind hingegen unersetzlich.


    Raid Systeme

    Immer wieder kommt bei Selbstbau NAS Geräten die Frage auf, welcher Raid Controller verwendet werden soll oder ob Software Raid die bessere Wahl ist.
    Dies kann man so pauschal nicht beantworten, es kommt wie immer auf die Umstände an. Manche Betriebssysteme beherrschen kein zuverlässiges Software Raid, da muss man mit Hardware nachhelfen. Bei anderen Betriebssystemen und Hochleistungs-Dateisystemen wie ZFS sind Hardware Raid Controller sogar schädlich und sollten auf keinen Fall verwendet werden weil diese Systeme den direkten Kontakt zu den Festplatten benötigen um ihre volle Leistungsfähigkeit und alle technischen Features ausspielen zu können.

    Beim Begriff Hardware Raid Controller gibt es immer wieder erhebliche Missverständnisse. Die auf Hauptplatinen verbauten oder aber separaten Karten der 20-75 Euro Klasse sind die sogenannten „Fake-Raid“ oder „Windows Fake-Raid“ Controller. Hier wird die gesamte benötigte Rechenleistung durch einen Treiber an die CPU des Windows Rechners weitergereicht und die Karte besitzt bis auf ein Boot-ROM keinerlei Eigenintelligenz.

    Echte Hardware Raid Controller sind regelrechte eigenständige Rechner. Sie beinhalten ihre eigene CPU, eigenen Arbeitsspeicher und im ROM ihr eigenes kleines Betriebssystem. Bei diesen Produkten ist mit Preisen ab 250,- Euro aufwärts zu rechnen.

    Man sollte immer wieder bedenken, dass Hardware Raid Controller zu Zeiten der Rechnerklasse Pentium 2 Ihre Existenzberechtigung hatten, die durch den Controller entlastete CPU konnte sich dann ihren eigentlichen Aufgaben widmen. Zu heutigen Zeiten, wo die Systeme so leistungsstark geworden sind, dass man diese eigentlich nur noch mit CAD Berechnungen oder Video-Transcodierungen hinreichend beschäftigen kann, gibt es keine Leistungssteigerungen mehr durch Hardware Controller zu erreichen.

    Auch sind die Software Lösungen mittlerweile so stabil und ausgereift, dass es je nach System keinerlei Einschränkungen mehr gegenüber Hardware gibt, im Gegenteil sind durch die starken Prozessoren mittlerweile Software-Lösungen klar im Vorteil.

    Hardware Raid Controller

    - Hohe Kosten für echte Controller
    - Mitunter Datenverlust durch unsauber programmierte Windows-Treiber
    - Arrays können oft nur vom selben Controller, im schlimmsten Fall mit der gleichen Firmwareversion erkannt werden
    - Ob neue Festplatten-Generationen erkannt werden hängt davon ab, ob der Controller-Hersteller eine aktualisierte Firmware anbietet. Selbst viele teure Controller können daher keine Festplatten über 2TB erkennen.
    - Ein bestehendes Array kann normalerweise nicht nachträglich vergrößert werden
    - Die Reihenfolge, in der die Festplatten angeschlossen werden, ist von elementarer Bedeutung, gerade im Fall von Umzug auf neue Hardware können zwei in falscher Reihenfolge angeschlossene Platten eine verheerende Wirkung haben.
    - Da die Hardware keine Kenntnis des darauf liegenden Dateisystems hat, wird bei einem Rebuild jedes Bit kopiert, egal ob es sich um Nullen oder Daten handelt.
    - Ein Stromausfall während eines Schreibzugriffs kann verheerende Folgen für das Array haben.

    - Silent-data-corruption (sogenanntes Bit-Rot) können nicht vom Controller identifiziert werden, da dieser ja keine Beziehung zu dem Dateisystem hat. Wenn man betrachtet wie sich die Datendichte auf Festplatten erhöht hat, stellt man fest, dass dieser Effekt mit jeder neuen Festplattengeneration immer weiter geführt wird. Wer einmal seine Grafikdateien geöffnet hat und Querstreifen oder aber eine schlichte Fehlermeldung bekommen hat, weiß was „Datenkorruption" in der Praxis bedeutet wenn auch nur ein einziges Bit gekippt ist.


    Software Raid ist in den verschiedenen Betriebssystemen unterschiedlich implementiert.

    Unter Linux mit dem logischen Volumen Manager LVM bildet man die Arrays, die dann mit einem beliebigen Dateisystem formatiert werden.

    Da hier der Volume-Manager ebenfalls unabhängig vom Dateisystem operiert kommen wieder die Effekte des Hardware Controller zum Tragen, ein Rebuild kopiert jedes Bit und Silent-date-coruption kann nicht identifiziert werden.

    Von der Firma SUN ist für das Betriebssystem Solaris, einem Betriebssystem der Unix Familie, als Lösung all dieser Probleme für den Storagebereich das System ZFS entstanden. Diese Kombination von Volume-Manager, Dateisystem und Verwaltungstools ist von Anfang an für alle täglich auftretenden Dinge im Speicherbereich entstanden. Mit nur einem Befehl kann ein Speicherpool aus beliebigen Festplatten gebildet werden, wird automatisch mit dem Dateisystem ZFS versehen, eingehängt und kann sofort benutzt werden. Wer einmal ein 20 TB Array mit einem Standard Dateisystem formatiert hat, wird nicht glauben, dass dieser Vorgang mit ZFS ein paar Sekunden dauert.

    Mit einem anderen Befehl werden in diesem Speicherpool eigene Dateisysteme erzeugt, die wie gewöhnliche Verzeichnisse aussehen, aber wesentlich mächtiger sind. Es lassen sich Quotas einrichten, Snapshots erstellen, und und und…

    Eine Erweiterung dieser Pools war von Anfang an immer vorgesehen, neue Festplattenverbunde lassen sich als sogenanntes VDEV dem Pool hinzufügen.
    Durch Austausch einer Festplatte durch eine größere und einem anschließenden Rebuild hat nach dem Austausch der letzten Platte der Pool den zusätzlichen Speicherplatz zur Verfügung.
    So lassen sich die 2TB Platten dann bequem durch die neuen 4TB Platten ersetzen.

    Besonders hervorzuheben ist noch die Tatsache, dass durch die direkte Kenntnis über die belegten Bereiche des Pool bei einem Rebuild immer nur die tatsächlich belegten Bereiche betrachtet werden. Ein Rebuild ist somit wesentlich schneller erledigt, als bei einem konventionellen Raid Array.

    (verfasst von shakky4711)