Unterschiedliche RAID-Stufen bieten unterschiedliche Vorteile. Einige bieten Leistungssteigerungen, indem sie Speicherkapazität und Lese-/Schreib-E/A bündeln, während andere durch Datenredundanz vor Hardwareausfällen schützen.

Unter diesen Ebenen sind RAID 5 und 6 zwei der beliebtesten in letzter Zeit, da sie eine Kombination aus Leistung und Sicherheit bieten. Aufgrund ihrer verschiedenen Ähnlichkeiten kann es verwirrend sein, herauszufinden, wann es am besten ist, RAID 5 im Vergleich zu RAID 6 zu verwenden Unterschiede und wann eines der beiden in diesem Artikel zu verwenden ist.

Was ist RAID 5?

Wie bereits erwähnt, konzentrieren sich verschiedene RAID-Level in unterschiedlichem Maße auf Datenschutz und Leistungsverbesserung. RAID 5 bietet beides durch blockverschachtelte verteilte Parität.

Das bedeutet, dass Striping auf Blockebene erfolgt. Die Größe dieser Blöcke, auch Chunk-Größe genannt, kann vom Benutzer festgelegt werden, liegt jedoch normalerweise zwischen 64 KB und 1 MB.

Zusätzlich wird für jeden Stripe ein Stück Paritätsdaten geschrieben. Diese Paritätsblöcke werden über das Array verteilt, anstatt auf einer dedizierten Paritätsfestplatte gespeichert zu werden.

Wir werden weiter unten in diesem Artikel erläutern, warum RAID 5 Parität auf diese Weise handhabt, aber letztendlich führt dies dazu, dass eine Festplatte im Wert von Speicherplatz für Paritätsdaten reserviert wird.

Vorteile: Fehlertoleranz gegen einzelne Festplattenausfälle Hohe nutzbare Speicherkapazität Hohe Lesegeschwindigkeit Kann mit einem Hardware-Controller eingerichtet oder über Software implementiert werden Nachteile: Beeinträchtigung der Schreibleistung Kann nur einen Festplattenausfall verarbeiten. Mehr führt zum Ausfall des Arrays Riskanter Neuaufbauprozess

Was ist RAID 6?

RAID 6 ist RAID 5 sehr ähnlich, aber es verwendet zwei verteilte Paritätsblöcke über einen Stripe statt nur einen. Dieses eine Detail ändert alles, von der Fehlertoleranz des Arrays bis hin zu Leistung und nutzbarem Speicher.

Das zweimalige Schreiben der Parität macht das Array viel zuverlässiger, aber aus dem gleichen Grund leidet auch die Schreibleistung doppelt so stark. Die Leseleistung ist jedoch, ähnlich wie bei RAID 5, ausgezeichnet.

Vorteile: Fehlertoleranz bei zwei Festplattenausfällen Hervorragende Leseleistung Die Wiederherstellung nach einem Festplattenausfall ist sicherer Nachteile: Höherer Schreibleistungs-Overhead Platzbedarf von zwei Festplatten für Parität

RAID 5 vs. RAID 6 – Hauptunterschiede

RAID 5 und 6 unterscheiden sich hauptsächlich darin, dass RAID 6 zwei Paritätsblöcke pro Stripe verwendet RAID 5 verwendet nur einen. Aber wie gesagt, dies führt auch zu einigen anderen Unterschieden, die wir in den folgenden Abschnitten behandeln werden.

Fehlertoleranz

Das erste, was die Anzahl der Paritätsblöcke beeinflusst ist die Fehlertoleranzstufe. In einem RAID 5-Array wird für jeden Stripe ein blockgroßes Stück Paritätsdaten geschrieben. Im Falle eines Festplattenausfalls können die verlorenen Daten unter Verwendung der Paritätsdaten und der Daten auf den anderen Festplatten im Array neu berechnet werden.

Im Wesentlichen bedeutet dies, dass ein RAID 5-Array einen Festplattenausfall ohne Datenverlust bewältigen kann. Normalerweise sowieso. Diese Fehlertoleranz war der Grund, warum RAID 5 bis in die 2010er Jahre sehr beliebt war. Heutzutage wird RAID 5 jedoch selten verwendet, da seine Zuverlässigkeit nicht mehr den Anforderungen entspricht. Dies liegt an der Art und Weise, wie die meisten Hardware-RAID-Controller Wiederherstellungen handhaben.

Wenn der Controller während der Wiederherstellung auf einen nicht behebbaren Lesefehler (URE) stößt, markiert er normalerweise das gesamte Array als fehlgeschlagen, um eine weitere Datenbeschädigung zu verhindern. Wenn Sie keine Backups haben oder planen, Daten von einzelnen Festplatten wiederherzustellen, gehen die Daten verloren.

Die Festplattengröße ist in den letzten zwei Jahrzehnten exponentiell gewachsen, aber die Verbesserungen der Lese-/Schreibgeschwindigkeit waren viel moderater. Im Wesentlichen wuchs die Größe der Arrays viel stärker als die Datenübertragungsgeschwindigkeiten, was bedeutete, dass die Wiederherstellungszeiten sehr lang wurden.

Je nach Konfiguration konnte die Wiederherstellung des Arrays nach einem Festplattenausfall mehrere Stunden dauern zu Tagen. Solche Wiederherstellungszeiten bedeuteten eine höhere Wahrscheinlichkeit, dass während der Wiederherstellung auf UREs gestoßen wird, was zu einer höheren Wahrscheinlichkeit führt, dass das gesamte Array ausfällt.

In den letzten Jahren sind die URE-Vorkommensraten in HDDs dank technologischer Verbesserungen erheblich gesunken. Aus diesem Grund wird hier und da noch RAID 5 verwendet. Aber der allgemeine Branchenkonsens ist immer noch, sich für RAID 6 oder andere Ebenen zu entscheiden, und das aus gutem Grund.

Bei RAID 6 werden Paritätsdaten zweimal pro Stripe geschrieben. Dies bedeutet, dass ein RAID 6-Array bis zu zwei Festplattenausfälle ohne Datenverlust überstehen kann. Dadurch wird RAID 6 viel zuverlässiger und eignet sich daher besser für größere Arrays mit wichtigen Daten.

Schreibleistung

Ein RAID 5-Array muss die Daten lesen, die Parität berechnen, die Daten schreiben und dann die Parität. Aus diesem Grund erleidet RAID 5 einen Nachteil bei Workloads mit Schreibvorgängen.

RAID 6 beinhaltet das zweimalige Berechnen und Schreiben der Parität, was für die Zuverlässigkeit großartig ist, aber es bedeutet auch, dass es den doppelten Overhead für Schreibvorgänge erleidet.

Für kleinere E/A-Größen ( normalerweise 256 KB und weniger), RAID 5 und 6 haben eine sehr vergleichbare Schreibleistung. Aber bei größeren E/A-Größen ist RAID 5 definitiv überlegen.

Anzahl der Festplatten

RAID 5 erfordert zwei Festplatten für das Striping und eine Festplatte mit ausreichend Speicherplatz zum Speichern von Paritätsdaten. Dies bedeutet, dass ein RAID 5-Array mindestens 3 Festplatteneinheiten benötigt.

RAID 6 ist ähnlich, erfordert jedoch mindestens 4 Festplatten, da Paritätsdaten zwei Festplatten Platz belegen.

Nutzbarer Speicher

In einem RAID 5-Array kann der nutzbare Speicher mit (N – 1) x (Kleinste Festplattengröße) berechnet werden, wobei N die Anzahl der Festplatteneinheiten ist. Zum Beispiel haben wir unten ein RAID 5-Array mit drei 1-TB-Festplatten gezeigt. Der Speicherplatz einer Festplatte wird zum Speichern von Paritätsdaten verwendet, und da die kleinste Festplattengröße 1 TB beträgt, beträgt der nutzbare Speicherplatz 2 TB.

Es ist wichtig zu versuchen, Festplatten gleicher Größe zu verwenden, da sonst die kleinste Festplatte eine Engpass, der zu viel ungenutztem Speicherplatz führt. Das folgende Beispiel zeigt dasselbe Szenario, bei dem die 500-GB-Festplatte dazu geführt hat, dass 1,5 TB unbrauchbar geworden sind.

In einem RAID 6-Array wird der nutzbare Speicher mit (N – 2) x (Kleinste Festplattengröße) berechnet. Auch hier ist es wichtig, Festplatten gleicher Größe zu verwenden, um sicherzustellen, dass es keinen unbrauchbaren Speicherplatz im Array gibt.

Paritätsberechnung

In RAID 5 wird eine XOR-Operation für jedes Datenbyte durchgeführt, um Paritätsinformationen in RAID 5 zu berechnen Angenommen, das erste Datenbyte in einem Array mit 4 Festplatten sieht etwa so aus:

A1 – 11010101
A2 – 10001100
A3 – 10101100

Wenn wir eine XOR-Operation auf den ersten beiden Streifen (A1 und A2) durchführen und dann dasselbe mit dem Ausgang und dem dritten Streifen (A3) tun, ist der Ausgang die Paritätsinformation (Ap). In diesem Fall ist der Wert 11110101.

Wenn eine Festplatte (z. B. Festplatte 1) ausfällt, passiert Folgendes. Zuerst gibt uns A2 XOR A3 die Ausgabe 00100000. Wenn wir diese Ausgabe in einer XOR-Operation mit Ap verwenden, erhalten wir als Ergebnis 11010101, was die verlorenen Daten sind.

00100000
11110101
11010101

So werden Paritätsdaten im Grunde berechnet und verwendet, um verlorene Daten in RAID 5 neu zu berechnen. 

RAID 6 ist viel komplexer, da es die Parität zweimal berechnet. Je nach Setup wird dies auf verschiedene Arten implementiert, z. B. Dual-Check-Datenberechnung (Parität und Reed-Solomon), orthogonale Dual-Parity-Check-Daten, diagonale Parität usw.

RAID-Controller

RAID 5 kann sowohl durch Hardware als auch durch Software implementiert werden. Ersteres beinhaltet offensichtlich die Verwendung eines dedizierten Hardware-RAID-Controllers. Da RAID 5 eine Paritätsberechnung erfordert, ist dies die empfohlene Route.

Dies ist besonders wichtig in bestimmten Fällen, wie bei einem NAS, wo der Prozessor nicht leistungsfähig genug ist, um die Berechnungen zu bewältigen, ohne einen signifikanten Engpass zu erzeugen.

Obwohl aus Leistungsgründen nicht ideal, RAID 5 kann auch über Softwarelösungen eingerichtet werden. Mit Windows können Sie beispielsweise Ihre Festplatten mithilfe der Funktion „Speicherplätze“ zusammenfassen. Sie können auch über die Datenträgerverwaltung ein RAID 5-Volume erstellen.

RAID 6 hingegen erfordert einen Hardware-RAID-Controller. Dies liegt daran, dass die zur Berechnung der zweiten Paritätsschicht durchgeführten polynomischen Berechnungen ziemlich prozessorintensiv sind.

Sind RAID 5 und RAID6 ähnlich?

Es sollte an dieser Stelle klar sein, dass RAID 5 und 6 haben einige wesentliche Unterschiede, sie sind sich auch in vielerlei Hinsicht ähnlich. Zunächst einmal bieten RAID 5 und 6 im Gegensatz zu RAID 1 Fehlertoleranz durch Parität anstelle von Spiegelung.

Insbesondere verwenden sie verteilte Parität, die sich von den dedizierten Paritätsfestplatten unterscheidet, die von RAID 2, 3 und 4 verwendet werden. Bei verteilter Parität müssen Sie sich keine Gedanken über Engpässe wie bei einer einzelnen Parität machen Festplatte.

Sowohl RAID 5 als auch 6 haben dank Data Striping eine hervorragende Leseleistung. Aber aus dem gleichen Grund erleiden beide auch Einbußen bei der Schreibleistung, wenn auch in unterschiedlichem Ausmaß.

Was ist gut an RAID 5?

RAID 5 bietet eine gute Mischung aus nutzbarem Speicher , Datenschutz und Leistung. Sie können es auch mit weniger Festplatten einrichten, was es zu einer budgeteffizienten Option macht.

Wenn Sie in Bezug auf die Leistung denken möchten, ist RAID 5 am besten für Workloads geeignet, die hauptsächlich Leseoperationen wie E-Mail-Server beinhalten.

Was die Fehlertoleranz betrifft, haben wir bereits behandelt wie RAID 5 im Laufe der Jahre weniger zuverlässig geworden ist. Für kleine Arrays ist es immer noch in Ordnung, aber bei größeren Arrays, bei denen die Wahrscheinlichkeit fehlgeschlagener Wiederherstellungen höher ist, würden wir RAID 5 nicht empfehlen.

Wann ist RAID 6 besser?

Die Zuverlässigkeit von RAID 6 geht zu Lasten der Schreibleistung und des nutzbaren Speicherplatzes. Dieser kleine Unterschied lohnt sich jedoch zweifellos, wenn die Daten auf den Festplatten wichtig sind.

RAID 6 ist nicht das Beste für kleinere Arrays (z. B. 4 Festplatten), da ein erheblicher Teil des Speichers verloren geht zu Redundanz. Wenn in kleinen Arrays Redundanz erforderlich ist, wäre RAID 5 oder etwas wie RAID 10 besser.

Stattdessen eignet sich RAID 6 am besten für größere Arrays, bei denen die Möglichkeit besteht, dass viel mehr Daten verloren gehen, wenn das Setup nicht stimmt. nicht zuverlässig.

Endgültiges Urteil – RAID 5 vs. RAID 6

RAID 5 ist nicht völlig unzuverlässig und für kleinere Arrays immer noch verwendbar. Aber bei wirklich kritischen Daten sollten Sie dem Schutz Vorrang vor geringfügigen Leistungsunterschieden geben, und hier greift RAID 6.

Unabhängig davon, für welches RAID-Level Sie sich entscheiden, ist es jedoch wichtig, dies zu verstehen RAID ist kein Backup. Die Redundanz von RAID schützt nur vor Festplattenausfällen. Sogar ein RAID 6-Array kann während der Wiederherstellung ausfallen.

Wenn die Daten auf den Festplatten wichtig genug sind, um RAID 6 oder andere”zuverlässige”Versionen zu verwenden, dann dürfen Sie Backups und Patrouillenlesevorgänge nicht auf die leichte Schulter nehmen, entweder. Abschließend, um es noch einmal zusammenzufassen, hier sind die Hauptunterschiede zwischen RAID 5 und RAID 6:

RAID 5RAID 6Parity LayersParitätsdaten werden einmal berechnet.Paritätsdaten werden zweimal berechnet.FehlertoleranzKann einen Festplattenfehler tolerieren.Kann zwei Festplattenfehler tolerieren.SchreibleistungDie Schreibleistung leidet darunter.Schreiben die Leistung leidet unter einem vergleichsweise größeren Overhead.MindestfestplattenMindestens 3 Festplatten sind erforderlich.Mindestens 4 Festplatten sind erforderlich.Nutzbarer SpeicherBietet mehr nutzbaren Speicher.Der nutzbare Speicher ist vergleichsweise geringer.ParitätsberechnungDie Parität wird durch eine einfache XOR-Operation berechnet.Die Parität wird mithilfe von XOR zusammen mit anderen komplexen Algorithmen berechnet.ImplementierungKann mithilfe von Hardware-oder Softwarelösungen implementiert werden.Erfordert einen dedizierten Hardware-RAID-Controller.

Categories: IT Info