Verschillende RAID-niveaus bieden verschillende voordelen. Sommige bieden prestatieverbeteringen door opslagcapaciteit en lees-/schrijf-I/O te bundelen, terwijl andere beschermen tegen hardwarestoringen door gegevensredundantie.

Van deze niveaus zijn RAID 5 en 6 twee van de meest populaire in de laatste tijd, omdat ze een combinatie bieden van zowel prestaties als veiligheid. Vanwege hun verschillende overeenkomsten kan het verwarrend zijn om erachter te komen wanneer het het beste is om RAID 5 versus RAID 6 te gebruiken. 

Als zodanig zullen we bespreken wat deze twee RAID-niveaus precies zijn, hun belangrijkste overeenkomsten en verschillen, en wanneer je een van beide moet gebruiken in dit artikel.

Wat is RAID 5?

Zoals gezegd zijn verschillende RAID-niveaus in verschillende mate gericht op gegevensbescherming en prestatieverbetering. RAID 5 biedt beide door middel van blok-interleaved gedistribueerde pariteit.

Dit betekent dat striping plaatsvindt op blokniveau. De grootte van deze blokken, ook wel chunk-grootte genoemd, is aan de gebruiker om in te stellen, maar varieert meestal van 64 KB-1 MB.

Bovendien wordt voor elke streep één stuk pariteitsgegevens geschreven. Deze pariteitsblokken zijn verspreid over de array in plaats van te worden opgeslagen op een speciale pariteitsschijf.

We zullen verderop in het artikel bespreken waarom RAID 5 pariteit op deze manier behandelt, maar uiteindelijk resulteert dit in een schijfruimte die wordt gereserveerd voor pariteitsgegevens.

Voors: Fouttolerantie tegen uitval van een enkele schijf Hoge bruikbare opslagcapaciteit Hoge leessnelheid Kan worden ingesteld met een hardwarecontroller of worden geïmplementeerd via software Nadelen: Straf op schrijfprestaties Kan slechts één schijffout aan. Meer leidt tot falen van de array Riskant herbouwproces

Wat is RAID 6?

RAID 6 lijkt veel op RAID 5, maar het gebruikt twee gedistribueerde pariteitsblokken over een stripe in plaats van één. Dit ene detail verandert alles, van het niveau van fouttolerantie geleverd door de array tot de prestaties en bruikbare opslag.

Twee keer schrijven van pariteit maakt de array veel betrouwbaarder, maar tegelijkertijd worden de schrijfprestaties ook twee keer zo zwaar bestraft. De leesprestaties zijn echter, net als RAID 5, uitstekend.

Voors: Fouttolerantie tegen twee schijffouten Geweldige leesprestaties Opnieuw opbouwen na schijffout is veiliger Nadelen: Hogere overhead voor schrijfprestaties Twee schijven aan ruimte nodig voor pariteit

RAID 5 versus RAID 6 – Belangrijkste verschillen

RAID 5 en 6 verschillen voornamelijk in het feit dat RAID 6 twee pariteitsblokken per stripe gebruikt, terwijl RAID 5 gebruikt er maar één. Maar zoals gezegd leidt dit ook tot een aantal andere verschillen, die we in de volgende paragrafen zullen bespreken.

Fouttolerantie

Het eerste dat het aantal pariteitsblokken beïnvloedt is het fouttolerantieniveau. In een RAID 5-array wordt voor elke stripe één blok pariteitsgegevens geschreven. In het geval van een schijfstoring, kunnen de verloren gegevens opnieuw worden berekend met behulp van de pariteitsgegevens en de gegevens op de andere schijven in de array.

In wezen betekent dit dat een RAID 5-array één schijfstoring kan verwerken zonder enig gegevensverlies. Meestal toch. Deze fouttolerantie was de reden waarom RAID 5 tot de jaren 2010 erg populair was. Tegenwoordig wordt RAID 5 echter zelden gebruikt omdat de betrouwbaarheid niet langer voldoet. Dit komt door de manier waarop de meeste hardware RAID-controllers met rebuilds omgaan.

Als de controller tijdens het opnieuw opbouwen een onherstelbare leesfout (URE) tegenkomt, markeert deze doorgaans de hele array als mislukt om verdere gegevensbeschadiging te voorkomen. Tenzij je back-ups hebt of van plan bent om gegevens van afzonderlijke schijven te herstellen, gaan de gegevens verloren.

De grootte van de HDD is de afgelopen twee decennia exponentieel gegroeid, maar de lees-/schrijfsnelheid was veel gematigder. In wezen nam de grootte van arrays veel sneller toe dan de gegevensoverdrachtsnelheden, wat betekende dat de tijden voor het opnieuw opbouwen erg lang begonnen te worden.

Afhankelijk van de opstelling, kon het opnieuw opbouwen van de array na een schijfstoring uren duren. tot dagen. Dergelijke herbouwtijden betekenden een grotere kans om URE’s tegen te komen tijdens het herbouwen, wat zich vertaalt in een grotere kans dat de hele array faalt.

In de afgelopen jaren is het aantal URE-incidenten in HDD’s aanzienlijk gedaald dankzij technologische verbeteringen. Hierdoor wordt RAID 5 hier en daar nog steeds gebruikt. Maar de algemene consensus in de sector is om nog steeds te kiezen voor RAID 6 of andere niveaus, en met goede reden.

In RAID 6 worden pariteitsgegevens twee keer per stripe geschreven. Dit betekent dat een RAID 6-array maximaal twee schijfstoringen kan doorstaan ​​zonder gegevensverlies. Dit maakt RAID 6 veel betrouwbaarder en dus beter geschikt voor grotere arrays met belangrijke gegevens.

Schrijfprestaties

Een RAID 5-array moet de gegevens lezen, de pariteit berekenen, de gegevens schrijven en vervolgens de pariteit. Hierdoor krijgt RAID 5 een boete voor werkbelastingen met schrijfbewerkingen.

RAID 6 omvat het twee keer berekenen en schrijven van pariteit, wat geweldig is voor de betrouwbaarheid, maar het betekent ook dat het twee keer zoveel overhead heeft voor schrijfbewerkingen.

Voor kleinere I/O-groottes ( doorgaans 256 KB en minder), hebben RAID 5 en 6 zeer vergelijkbare schrijfprestaties. Maar met grotere I/O-groottes is RAID 5 beslist superieur.

Aantal schijven

RAID 5 vereist twee schijven voor striping en één schijfruimte om pariteitsgegevens op te slaan. Dit betekent dat een RAID 5-array minimaal 3 schijfeenheden nodig heeft.

RAID 6 is vergelijkbaar, maar vereist minimaal 4 schijven omdat pariteitsgegevens twee schijven aan ruimte innemen.

Bruikbare opslag

In een RAID 5-array kan de bruikbare opslag worden berekend met (N – 1) x (kleinste schijfgrootte), waarbij N het aantal schijfstations is. We hebben bijvoorbeeld hieronder een RAID 5-array weergegeven met drie schijven van 1 TB. Er wordt één schijfruimte gebruikt om pariteitsgegevens op te slaan, en aangezien de kleinste schijfgrootte 1 TB is, komt de bruikbare ruimte uit op 2 TB.

Het is belangrijk om te proberen schijven van dezelfde grootte te gebruiken, omdat de kleinste schijf anders een bottleneck wat resulteert in veel onbruikbare ruimte. Het onderstaande voorbeeld toont hetzelfde scenario, waarbij de schijf van 500 GB ertoe heeft geleid dat 1,5 TB onbruikbaar is geworden.

In een RAID 6-array wordt de bruikbare opslag berekend met (N – 2) x (kleinste schijfgrootte). Nogmaals, het is belangrijk om schijven van dezelfde grootte te gebruiken om ervoor te zorgen dat er geen onbruikbare ruimte in de array is.

Pariteitsberekening

In RAID 5 wordt een XOR-bewerking uitgevoerd op elke byte aan gegevens om de pariteitsinformatie in RAID 5 te berekenen Laten we bijvoorbeeld zeggen dat de eerste byte aan gegevens in een array met 4 schijven er ongeveer zo uitziet:

A1 – 11010101
A2 – 10001100
A3 – 10101100

Als we een XOR-bewerking uitvoeren op de eerste twee strips (A1 en A2) en vervolgens hetzelfde doen met de uitvoer en de derde strip (A3), is de uitvoer de pariteitsinformatie (Ap). In dit geval is de waarde 11110101.

Als een schijf (bijvoorbeeld Schijf 1) uitvalt, gebeurt het volgende. Ten eerste geeft A2 XOR A3 ons de uitvoer 00100000. Wanneer we deze uitvoer gebruiken in een XOR-bewerking met Ap, krijgen we 11010101 als resultaat, wat de verloren gegevens zijn.

00100000
11110101
11010101

Dit is in feite hoe pariteitsgegevens worden berekend en gebruikt om verloren gegevens in RAID 5 opnieuw te berekenen. 

RAID 6 is veel complexer omdat het de pariteit twee keer berekent. Afhankelijk van de opstelling wordt dit op verschillende manieren geïmplementeerd, zoals dubbele controlegegevensberekening (pariteit en Reed-Solomon), orthogonale dubbele pariteitscontrolegegevens, diagonale pariteit, enz.

RAID-controller

RAID 5 kan zowel via hardware als software worden geïmplementeerd. De eerste omvat uiteraard het gebruik van een speciale hardware RAID-controller. Aangezien RAID 5 pariteitsberekening vereist, is dit de aanbevolen route.

Dit is vooral belangrijk in bepaalde gevallen, zoals bij een NAS, waar de processor niet krachtig genoeg is om de berekeningen uit te voeren zonder een significant knelpunt te creëren.

Hoewel om prestatieredenen niet ideaal, RAID 5 kan ook worden ingesteld met behulp van softwareoplossingen. Met Windows kunt u bijvoorbeeld uw schijven samenvoegen met behulp van de functie opslagruimten. U kunt ook een RAID 5-volume maken via Schijfbeheer.

RAID 6 daarentegen vereist een hardware RAID-controller. Dit komt omdat de polynoomberekeningen die worden uitgevoerd om de tweede pariteitslaag te berekenen behoorlijk processorintensief zijn.

Zijn RAID 5 en RAID6 vergelijkbaar?

Het zou op dit punt duidelijk moeten zijn dat terwijl RAID 5 en 6 hebben enkele belangrijke verschillen, ze zijn ook in veel opzichten vergelijkbaar. Om te beginnen bieden RAID 1, RAID 5 en 6 fouttolerantie door pariteit in plaats van spiegeling.

Specifiek gebruiken ze gedistribueerde pariteit, wat verschilt van de speciale pariteitsschijven die worden gebruikt door RAID 2, 3 en 4. Met gedistribueerde pariteit hoeft u zich geen zorgen te maken over knelpunten zoals bij een enkele pariteit schijf.

Zowel RAID 5 als 6 hebben uitstekende leesprestaties dankzij datastriping. Maar op dezelfde manier lijden ze allebei ook boetes op de schrijfprestaties, zij het in verschillende mate.

Wat is er goed aan RAID 5?

RAID 5 biedt een goede mix van bruikbare opslag , gegevensbescherming en prestaties. U kunt het ook instellen met minder schijven, waardoor het een budgetvriendelijke optie is.

Als u in termen van prestaties wilt denken, is RAID 5 het meest geschikt voor workloads met grote leesbewerkingen zoals e-mailservers.

Wat betreft fouttolerantie hebben we het al gehad hoe RAID 5 in de loop der jaren minder betrouwbaar is geworden. Het is nog steeds prima voor kleine arrays, maar met grotere arrays, waar de kans op mislukte heropbouw groter is, raden we RAID 5 niet aan.

Wanneer is RAID 6 beter?

De betrouwbaarheid van RAID 6 gaat ten koste van de schrijfprestaties en bruikbare opslag. Dit kleine verschil is echter ongetwijfeld de moeite waard wanneer de gegevens op de schijven belangrijk zijn.

RAID 6 is niet de beste voor kleinere arrays (bijv. 4 schijven), omdat een aanzienlijk deel van de opslagruimte verloren gaat tot redundantie. Als redundantie vereist is in kleine arrays, zou RAID 5 of iets als RAID 10 beter zijn.

In plaats daarvan is RAID 6 het meest geschikt voor grotere arrays waar de kans bestaat dat er veel meer gegevens verloren gaan als de installatie niet wordt uitgevoerd. t betrouwbaar.

Eindoordeel – RAID 5 versus RAID 6

RAID 5 is niet helemaal onbetrouwbaar, en het is nog steeds bruikbaar voor kleinere arrays. Maar met echt kritieke gegevens, wilt u de bescherming belangrijker vinden dan kleine prestatieverschillen, en dat is waar RAID 6 de kroon opsteekt.

Ongeacht voor welk RAID-niveau u kiest, het is echter belangrijk om te begrijpen dat RAID is geen back-up. De redundantie van RAID beschermt alleen tegen schijfstoringen. Zelfs een RAID 6-array kan tijdens het opnieuw opbouwen uitvallen.

Als de gegevens op de schijven belangrijk genoeg zijn voor u om RAID 6 of andere’betrouwbare’versies te gebruiken, moet u back-ups niet lichtvaardig nemen en patrouilleren, of. Tot slot, om samen te vatten, zijn hier de belangrijkste verschillen tussen RAID 5 en RAID 6:

RAID 5RAID 6PariteitslagenPariteitsgegevens worden één keer berekend. Pariteitsgegevens worden twee keer berekend.FouttolerantieKan één schijffout tolereren.Kan twee schijffouten tolereren.SchrijfprestatiesSchrijfprestaties lijden een nadeel.Schrijven prestaties hebben relatief meer overhead.Minimum schijvenEr zijn minimaal 3 schijven vereist.Er zijn minimaal 4 schijven vereist.Bruikbare opslagBiedt meer bruikbare opslagruimte. Bruikbare opslag is relatief minder.PariteitsberekeningPariteit wordt berekend via een eenvoudige XOR-bewerking. Pariteit wordt berekend met behulp van XOR samen met andere complexe algoritmen.ImplementatieKan worden geïmplementeerd met behulp van hardware-of softwareoplossingen. Vereist speciale hardware RAID-controller.

Categories: IT Info