Diferitele niveluri RAID oferă diferite beneficii. Unele oferă câștiguri de performanță prin gruparea capacității de stocare și I/O de citire/scriere, în timp ce altele protejează împotriva defecțiunilor hardware prin redundanța datelor.
Dintre aceste niveluri, RAID 5 și 6 au fost două dintre cele mai populare din recente, deoarece oferă o combinație între performanță și siguranță. Datorită diferitelor lor asemănări, poate fi confuz să ne dăm seama când este mai bine să utilizați RAID 5 vs RAID 6.
Ca atare, vom discuta care sunt exact aceste două niveluri RAID, principalele lor asemănări și diferențe și când să folosiți oricare dintre ele în acest articol.
Ce este RAID 5?
Așa cum am menționat, diferitele niveluri RAID se concentrează pe protecția datelor și îmbunătățirea performanței în diferite grade. RAID 5 le oferă ambele prin paritate distribuită intercalată în blocuri.
Aceasta înseamnă că striping apare la nivel de bloc. Dimensiunea acestor blocuri, cunoscută și sub numele de dimensiunea bucăților, este setată de utilizator, dar de obicei variază de la 64KB – 1MB.
În plus, pentru fiecare bandă, este scrisă o bucată de date de paritate. Aceste blocuri de paritate sunt răspândite în matrice în loc să fie stocate pe un disc de paritate dedicat.
Vom discuta de ce RAID 5 gestionează paritatea astfel în continuare în articol, dar în cele din urmă, acest lucru are ca rezultat rezervarea unui spațiu pe disc pentru datele de paritate.
Pro: Toleranță la defecțiuni împotriva defecțiunii unui singur disc Capacitate mare de stocare utilizabilă Viteză mare de citire Poate fi configurată cu un controler hardware sau implementată prin intermediul unui software Contra: Penalizare la performanța de scriere Poate face față doar unei erori de disc. Mai mult duce la eșecul matricei Proces de reconstrucție riscant
Ce este RAID 6?
RAID 6 seamănă mult cu RAID 5, dar folosește două blocuri de paritate distribuite pe o bandă în loc de unul. Acest detaliu schimbă totul, de la nivelul de toleranță la erori oferit de matrice la performanță și stocare utilizabilă.
Scrierea parității de două ori face ca matricea să fie mult mai fiabilă, dar totodată și performanța de scriere suferă de două ori mai mult penalizare. Totuși, performanța de citire, la fel ca RAID 5, este excelentă.
Pro: Toleranță la erori la două defecțiuni ale discului Performanță mare de citire Reconstruirea după defecțiunea discului este mai sigură Contra: Performanță de scriere mai mare Două discuri în valoare de spațiu necesar pentru paritate
RAID 5 Vs RAID 6 – Principalele diferențe
RAID 5 și 6 diferă în principal prin faptul că RAID 6 utilizează două blocuri de paritate pe bandă, în timp ce RAID 5 folosește doar unul. Dar, așa cum am menționat, acest lucru duce și la o serie de alte diferențe, pe care le vom acoperi în secțiunile următoare.
Toleranța la erori
Primul lucru pe care îl afectează numărul de blocuri de paritate este nivelul de toleranță la erori. Într-o matrice RAID 5, este scrisă o bucată de date de paritate de dimensiunea unui bloc pentru fiecare bandă. În cazul defecțiunii discului, datele pierdute pot fi recalculate folosind datele de paritate și datele de pe celelalte discuri din matrice.
În esență, aceasta înseamnă că o matrice RAID 5 poate face față unei erori de disc fără nicio pierdere de date. De obicei, oricum. Această toleranță la erori a fost motivul pentru care RAID 5 a fost foarte popular până în anii 2010. Cu toate acestea, în zilele noastre, RAID 5 este rar utilizat, deoarece fiabilitatea sa nu mai este la egalitate. Acest lucru se datorează modului în care majoritatea controlerelor RAID hardware gestionează reconstrucțiile.
Dacă controlerul întâlnește o eroare de citire nerecuperabilă (URE) în timpul reconstrucției, de obicei va marca întreaga matrice ca eșuată pentru a preveni coruperea ulterioară a datelor. Dacă nu aveți copii de rezervă sau plănuiți să recuperați date de pe discuri individuale, datele se pierd.
Dimensiunile HDD-urilor au crescut exponențial în ultimele două decenii, dar îmbunătățirile vitezei de citire/scriere au fost mult mai moderate. În esență, dimensiunea matricelor a crescut cu rate mult mai mari decât vitezele de transfer de date, ceea ce a însemnat că timpii de reconstrucție au început să devină foarte lungi.
În funcție de configurare, reconstruirea matricei după ce un disc se defectează poate dura câteva ore. la zile. Astfel de timpi de reconstrucție au însemnat o șansă mai mare de a întâlni URE în timpul reconstrucției, ceea ce se traduce printr-o șansă mai mare ca întregul array să se defecteze.
În ultimii ani, ratele de apariție a URE în HDD-uri au scăzut semnificativ datorită îmbunătățirilor tehnologice. Din acest motiv, RAID 5 este încă folosit ici și acolo. Dar consensul general al industriei este de a opta în continuare pentru RAID 6 sau alte niveluri și din motive întemeiate.
În RAID 6, datele de paritate sunt scrise de două ori pe bandă. Aceasta înseamnă că o matrice RAID 6 poate suporta până la două erori de disc fără pierderi de date. Acest lucru face ca RAID 6 să fie mult mai fiabil și, prin urmare, mai potrivit pentru matrice mai mari cu date importante.
Performanța de scriere
O matrice RAID 5 trebuie să citească datele, să calculeze paritatea, să scrie datele și apoi paritatea. Din acest motiv, RAID 5 suferă o penalizare pentru sarcinile de lucru care implică scrieri.
RAID 6 implică calcularea și scrierea de două ori a parității, ceea ce este excelent pentru fiabilitate, dar înseamnă, de asemenea, că suferă de două ori mai multă supraîncărcare pentru operațiunile de scriere.
Pentru dimensiuni mai mici I/O ( de obicei 256 KB sau mai puțin), RAID 5 și 6 au performanțe de scriere foarte comparabile. Dar cu dimensiuni mai mari de I/O, RAID 5 este cu siguranță superior.
Numărul de discuri
RAID 5 necesită două discuri pentru stripare și un spațiu în valoare de un disc pentru a stoca date de paritate. Aceasta înseamnă că o matrice RAID 5 necesită cel puțin 3 unități de disc.
RAID 6 este similar, dar necesită minim 4 discuri, deoarece datele de paritate ocupă două discuri în valoare de spațiu.
Stocare utilizabilă
Într-o matrice RAID 5, stocarea utilizabilă poate fi calculată cu (N – 1) x (Dimensiunea cea mai mică a discului), unde N este numărul de unități de disc. De exemplu, am arătat mai jos o matrice RAID 5 cu trei discuri de 1 TB. Un spațiu de disc este folosit pentru a stoca datele de paritate și, deoarece cea mai mică dimensiune a discului este de 1 TB, spațiul utilizabil ajunge la 2 TB.
Este important să încercați să utilizați discuri de aceeași dimensiune, deoarece, în caz contrar, cel mai mic disc ar crea un blocaj care duce la o mulțime de spațiu inutilizabil. Exemplul de mai jos arată același scenariu, în care discul de 500 GB a dus la 1,5 TB inutilizabili.
Într-o matrice RAID 6, spațiul de stocare utilizabil este calculat cu (N – 2) x (Dimensiunea cea mai mică a discului). Încă o dată, este important să folosiți discuri de aceeași dimensiune pentru a vă asigura că nu există spațiu inutilizabil în matrice.
Calcul de paritate
În RAID 5, este efectuată o operație XOR pe fiecare octet de date pentru a calcula informațiile de paritate în RAID 5. De exemplu, să presupunem că primul octet de date dintr-o matrice de 4 discuri arată cam așa:
A1 – 11010101
A2 – 10001100
A3 – 10101100
Dacă efectuăm o operație XOR pe primele două benzi (A1 și A2) și apoi facem același lucru cu ieșirea și a treia bandă (A3), ieșirea este informația de paritate (Ap). În acest caz, valoarea sa este 11110101.
Când orice disc (de exemplu, discul 1) eșuează, iată ce se întâmplă. Mai întâi, A2 XOR A3 ne oferă ieșirea 00100000. Când folosim această ieșire într-o operație XOR cu Ap, obținem ca rezultat 11010101, care sunt datele pierdute.
00100000
11110101
11010101
În principiu, acesta este modul în care datele de paritate sunt calculate și utilizate pentru a recalcula datele pierdute în RAID 5.
RAID 6 este mult mai complex, deoarece calculează paritatea de două ori. În funcție de configurație, aceasta este implementată în diferite moduri, cum ar fi calculul datelor de verificare dublă (paritate și Reed–Solomon), date de verificare a parității duale ortogonale, paritate diagonală etc.
Controler RAID
RAID 5 poate fi implementat atât prin mijloace hardware cât și prin software. Primul implică în mod evident utilizarea unui controler hardware RAID dedicat. Deoarece RAID 5 necesită calcul de paritate, aceasta este ruta recomandată.
Acest lucru este deosebit de important în anumite cazuri, cum ar fi un NAS, unde procesorul nu este suficient de puternic pentru a gestiona calculele fără a crea un blocaj semnificativ..
Deși nu este ideal din motive de performanță, RAID 5 poate fi configurat și folosind soluții software. De exemplu, Windows vă permite să vă puneți în comun discurile folosind funcția de spații de stocare. De asemenea, puteți crea un volum RAID 5 prin Disk Management.
RAID 6, pe de altă parte, necesită un controler RAID hardware. Acest lucru se datorează faptului că calculele polinomiale efectuate pentru a calcula al doilea strat de paritate necesită destul de mult procesorul.
RAID 5 și RAID6 sunt similare?
Ar trebui să fie evident în acest moment că, în timp ce RAID 5 și 6 au câteva diferențe cheie, de asemenea, sunt similare în multe privințe. Pentru început, spre deosebire de RAID 1, RAID 5 și 6 oferă toleranță la erori prin paritate în loc de oglindire.
În mod specific, folosesc paritatea distribuită, care este diferită de discurile de paritate dedicate utilizate de RAID 2, 3 și 4. Cu paritatea distribuită, nu trebuie să vă faceți griji cu privire la blocajele ca în cazul unei singure parități. disc.
Atât RAID 5, cât și 6 au o performanță de citire excelentă datorită striping-ului de date. Dar, din același motiv, ambii suferă și penalități la performanța de scriere, deși în grade diferite.
Ce este bun la RAID 5?
RAID 5 oferă o combinație bună de stocare utilizabilă , protecția datelor și performanța. De asemenea, îl puteți configura cu mai puține discuri, ceea ce îl face o opțiune eficientă din punct de vedere bugetar.
Dacă doriți să vă gândiți în termeni de performanță, RAID 5 este cel mai potrivit pentru sarcinile de lucru care implică operațiuni de citire majoră, cum ar fi serverele de e-mail.
În ceea ce privește toleranța la erori, am abordat deja cum RAID 5 a devenit mai puțin fiabil de-a lungul anilor. Este încă bine pentru matrice de dimensiuni mici, dar cu matrice mai mari, unde există o șansă mai mare de reconstrucție eșuată, nu am recomanda RAID 5.
Când este RAID 6 mai bun?
Fiabilitatea RAID 6 vine cu prețul performanței de scriere și al stocării utilizabile. Cu toate acestea, această ușoară diferență merită, fără îndoială, atunci când datele de pe discuri sunt importante.
RAID 6 nu este cel mai bun pentru matrice mai mici (de exemplu, 4 discuri), deoarece o parte semnificativă a spațiului de stocare se pierde la redundanţă. Dacă este necesară redundanța în matricele mici, RAID 5 sau ceva de genul RAID 10 ar fi mai bine.
În schimb, RAID 6 este cel mai potrivit pentru matrice mai mari unde există șansa de a pierde mult mai multe date dacă configurarea nu este nu este fiabil.
Verdictul final – RAID 5 vs RAID 6
RAID 5 nu este complet nesigur și este încă utilizabil pentru matrice mai mici. Dar, cu date cu adevărat critice, veți dori să acordați prioritate protecției față de diferențele minore de performanță și aici RAID 6 ia tortul.
Indiferent de nivelul RAID pentru care optați, totuși, este important să înțelegeți că RAID nu este o copie de rezervă. Redundanța RAID protejează doar împotriva defecțiunii discului. Chiar și o matrice RAID 6 poate eșua în timpul reconstituirilor.
Dacă datele de pe discuri sunt suficient de importante pentru a putea folosi RAID 6 sau alte versiuni „de încredere”, atunci nu trebuie să luați copii de siguranță și să citiți cu ușurință, fie. În cele din urmă, pentru a recapitula, iată diferențele cheie dintre RAID 5 și RAID 6: