Ulike RAID-nivåer gir forskjellige fordeler. Noen gir ytelsesforbedringer ved å samle lagringskapasitet og lese/skrive I/O, mens andre beskytter mot maskinvarefeil gjennom dataredundans.
Blant disse nivåene har RAID 5 og 6 vært to av de mest populære i nyere tid, da de gir en kombinasjon av både ytelse og sikkerhet. På grunn av deres ulike likheter, kan det være forvirrende å finne ut når det er best å bruke RAID 5 vs RAID 6.
Som sådan vil vi diskutere hva disse to RAID-nivåene er, deres viktigste likheter og forskjeller, og når du skal bruke begge i denne artikkelen.
Hva er RAID 5?
Som nevnt, fokuserer forskjellige RAID-nivåer på databeskyttelse og ytelsesforbedring i varierende grad. RAID 5 gir begge disse gjennom blokk-interleaved distribuert paritet.
Dette betyr at striping skjer på blokknivå. Størrelsen på disse blokkene, også kjent som chunk size, er opp til brukeren å angi, men den varierer vanligvis fra 64KB – 1MB.
I tillegg, for hver stripe, skrives en del av paritetsdata. Disse paritetsblokkene er spredt over arrayet i stedet for å bli lagret på en dedikert paritetsdisk.
Vi skal dekke hvorfor RAID 5 håndterer paritet som dette lenger i artikkelen, men til slutt resulterer dette i at én disk verdt av plass blir reservert for paritetsdata.
Fordeler: Feiltoleranse mot feil på én disk Høy brukbar lagringskapasitet Høy lesehastighet Kan settes opp med en maskinvarekontroller eller implementeres gjennom programvare Ikke: Straff på skriveytelse Kan bare håndtere én diskfeil. Flere fører til svikt i arrayen Risikofylt gjenoppbyggingsprosess
Hva er RAID 6?
RAID 6 ligner mye på RAID 5, men den bruker to distribuerte paritetsblokker over en stripe i stedet for én. Denne ene detaljen endrer alt fra nivået av feiltoleranse gitt av arrayet til ytelsen og brukbar lagring.
Å skrive paritet to ganger gjør matrisen mye mer pålitelig, men på samme måte lider skriveytelse også dobbelt så mye av straffen. Leseytelsen er imidlertid utmerket, omtrent som RAID 5.
Fordeler: Feiltoleranse mot to diskfeil God leseytelse Gjenoppbygging etter diskfeil er sikrere Imdeler: Høyere skriveytelse overhead To disker verdt plass nødvendig for paritet
RAID 5 vs RAID 6 – Hovedforskjeller
RAID 5 og 6 skiller seg hovedsakelig fra det faktum at RAID 6 bruker to paritetsblokker per stripe, mens RAID 5 bruker bare én. Men som nevnt fører dette til en rekke andre forskjeller også, som vi skal dekke i de følgende avsnittene.
Feiltoleranse
Det første paritetsblokktellingen påvirker er feiltoleransenivået. I en RAID 5-matrise skrives én blokkstørrelse med paritetsdata for hver stripe. I tilfelle diskfeil kan de tapte dataene beregnes på nytt ved å bruke paritetsdataene og dataene på de andre diskene i arrayet.
I hovedsak betyr dette at en RAID 5-matrise kan håndtere én diskfeil uten tap av data. Vanligvis i alle fall. Denne feiltoleransen var grunnen til at RAID 5 var veldig populær frem til 2010-tallet. I disse dager brukes imidlertid RAID 5 sjelden, da påliteligheten ikke lenger er på nivå. Dette skyldes måten de fleste maskinvare-RAID-kontrollere håndterer ombygginger.
Hvis kontrolleren støter på en uopprettelig lesefeil (URE) under gjenoppbyggingen, vil den typisk merke hele arrayet som mislykket for å forhindre ytterligere datakorrupsjon. Med mindre du har sikkerhetskopier eller planlegger å gjenopprette data fra individuelle disker, går dataene tapt.
HDD-størrelsene har vokst eksponentielt de siste to tiårene, men forbedringene i lese-/skrivehastigheten var mye mer moderate. I hovedsak økte størrelsen på matriser med mye større hastighet enn dataoverføringshastigheter, noe som betydde at gjenoppbyggingstiden begynte å bli veldig lang.
Avhengig av oppsettet, kan gjenoppbyggingen av matrisen etter en diskfeil ta fra timer. til dager. Slike gjenoppbyggingstider betydde en høyere sjanse for å støte på URE-er under gjenoppbyggingen, noe som betyr en høyere sjanse for at hele arrayet mislykkes.
I de siste årene har URE-forekomstraten på HDD-er falt betydelig takket være teknologiske forbedringer. På grunn av dette brukes RAID 5 fortsatt her og der. Men den generelle konsensusen i bransjen er å fortsatt velge RAID 6 eller andre nivåer, og det med god grunn.
I RAID 6 skrives paritetsdata to ganger per stripe. Dette betyr at en RAID 6-array kan tåle opptil to diskfeil uten tap av data. Dette gjør RAID 6 mye mer pålitelig og dermed bedre egnet for større arrays med viktige data.
Skriveytelse
En RAID 5-matrise må lese dataene, beregne pariteten, skrive dataene og deretter pariteten. På grunn av dette får RAID 5 en straff på arbeidsbelastninger som involverer skriving.
RAID 6 involverer beregning og skriving av paritet to ganger, noe som er flott for påliteligheten, men det betyr også at det lider dobbelt så mye for skriveoperasjoner.
For mindre I/O-størrelser ( typisk 256 KB og under), RAID 5 og 6 har svært sammenlignbar skriveytelse. Men med større I/O-størrelser er RAID 5 definitivt overlegen.
Antall disker
RAID 5 krever to disker for striping og én diskverdi for å lagre paritetsdata. Dette betyr at en RAID 5-matrise krever minst 3 diskenheter.
RAID 6 er lik, men den krever minimum 4 disker fordi paritetsdata opptar plass med to disker.
Anvendbar lagring
I en RAID 5-matrise kan den brukbare lagringen beregnes med (N – 1) x (minste diskstørrelse), der N er antall diskenheter. For eksempel har vi vist en RAID 5-matrise med tre 1 TB disker nedenfor. En diskverdi med plass brukes til å lagre paritetsdata, og siden den minste diskstørrelsen er 1 TB, kommer den brukbare plassen ut til 2 TB.
Det er viktig å prøve å bruke disker av samme størrelse, da ellers ville den minste disken skape en flaskehals som resulterer i mye ubrukelig plass. Eksemplet nedenfor viser samme scenario, der 500 GB-disken har resultert i at 1,5 TB er ubrukelig.
I en RAID 6-array beregnes den brukbare lagringen med (N – 2) x (minste diskstørrelse). Nok en gang er det viktig å bruke disker av samme størrelse for å sikre at det ikke er ubrukelig plass i arrayet.
Paritetsberegning
I RAID 5 utføres en XOR-operasjon på hver byte med data for å beregne paritetsinformasjon i RAID 5 La oss for eksempel si at den første byten med data i en 4-diskarray ser omtrent slik ut:
A1 – 11010101
A2 – 10001100
A3 – 10101100
Hvis vi utfører en XOR-operasjon på de to første stripene (A1 og A2) og deretter gjør det samme med utgangen og den tredje stripen (A3), er utgangen paritetsinformasjonen (Ap). I dette tilfellet er verdien 11110101.
Når en disk (for eksempel Disk 1) feiler, skjer dette. Først gir A2 XOR A3 oss utgangen 00100000. Når vi bruker denne utgangen i en XOR-operasjon med Ap, får vi 11010101 som et resultat, som er de tapte dataene.
00100000
11110101
11010101
Dette er i utgangspunktet hvordan paritetsdata beregnes og brukes til å omberegne tapte data i RAID 5.
RAID 6 er mye mer kompleks ettersom den beregner paritet to ganger. Avhengig av oppsettet implementeres dette på ulike måter, for eksempel databeregning med dobbel sjekk (paritet og Reed–Solomon), ortogonal sjekkdata med dobbel paritet, diagonal paritet osv.
RAID-kontroller
RAID 5 kan implementeres med både maskinvare og programvare. Førstnevnte innebærer åpenbart bruk av en dedikert maskinvare-RAID-kontroller. Siden RAID 5 krever paritetsberegning, er dette den anbefalte ruten.
Dette er spesielt viktig i visse tilfeller, som med en NAS, der prosessoren ikke er kraftig nok til å håndtere beregningene uten å skape en betydelig flaskehals.
Selv om det ikke er ideelt av ytelsesgrunner, RAID 5 kan også settes opp ved hjelp av programvareløsninger. For eksempel lar Windows deg slå sammen diskene dine ved å bruke lagringsplassfunksjonen. Du kan også opprette et RAID 5-volum via Diskbehandling.
RAID 6 krever på den annen side en RAID-kontroller for maskinvare. Dette er fordi polynomberegningene som utføres for å beregne det andre paritetslaget er ganske prosessorintensive.
Er RAID 5 og RAID6 like?
Det bør være tydelig på dette tidspunktet at mens RAID 5 og 6 har noen viktige forskjeller, de er også like på mange måter. For det første, i motsetning til RAID 1, gir RAID 5 og 6 feiltoleranse gjennom paritet i stedet for speiling.
Spesifikt bruker de distribuert paritet, som er forskjellig fra de dedikerte paritetsdiskene som brukes av RAID 2, 3 og 4. Med distribuert paritet trenger du ikke å bekymre deg for flaskehalser som med en enkelt paritet disk.
Både RAID 5 og 6 har utmerket leseytelse takket være datastriping. Men på samme måte lider begge av straffer på skriveytelse, om enn i ulik grad.
Hva er bra med RAID 5?
RAID 5 tilbyr en god blanding av brukbar lagring , databeskyttelse og ytelse. Du kan også sette den opp med færre disker, noe som gjør den til et budsjetteffektivt alternativ.
Hvis du vil tenke i form av ytelse, er RAID 5 best egnet for arbeidsbelastninger som involverer store leseoperasjoner som e-postservere.
Når det gjelder feiltoleranse, har vi allerede dekket hvordan RAID 5 har blitt mindre pålitelig med årene. Det er fortsatt greit for små arrays, men med større arrays, der det er større sjanse for mislykkede gjenoppbygginger, vil vi ikke anbefale RAID 5.
Når er RAID 6 bedre?
RAID 6s pålitelighet kommer på bekostning av skriveytelse og brukbar lagring. Imidlertid er denne lille forskjellen utvilsomt verdt det når dataene på diskene er viktige.
RAID 6 er ikke det beste for mindre arrays (f.eks. 4 disker), ettersom en betydelig del av lagringen går tapt til redundans. Hvis det kreves redundans i små arrays, vil RAID 5 eller noe sånt som RAID 10 være bedre.
I stedet er RAID 6 best egnet for større arrays der det er en sjanse for å miste mye mer data hvis oppsettet er t pålitelig.
Endelig dom – RAID 5 vs RAID 6
RAID 5 er ikke helt upålitelig, og det er fortsatt brukbart for mindre arrays. Men med virkelig kritiske data, vil du prioritere beskyttelse fremfor mindre ytelsesforskjeller, og det er her RAID 6 tar kaken.
Uansett hvilket RAID-nivå du velger, er det imidlertid viktig å forstå at RAID er ikke en sikkerhetskopi. RAIDs redundans beskytter bare mot diskfeil. Selv en RAID 6-array kan mislykkes under gjenoppbygging.
Hvis dataene på diskene er viktige nok til at du kan bruke RAID 6 eller andre’pålitelige’versjoner, må du ikke ta lett på sikkerhetskopier og patruljeavlesninger, enten. Til slutt, for å oppsummere, her er de viktigste forskjellene mellom RAID 5 vs RAID 6: