Livelli RAID diversi offrono vantaggi diversi. Alcuni forniscono miglioramenti delle prestazioni unendo la capacità di archiviazione e l’I/O di lettura/scrittura, mentre altri proteggono dai guasti hardware attraverso la ridondanza dei dati.
Tra questi livelli, RAID 5 e 6 sono stati due dei più popolari in tempi recenti, in quanto forniscono una combinazione di prestazioni e sicurezza. A causa delle loro varie somiglianze, può essere fonte di confusione capire quando è meglio utilizzare RAID 5 rispetto a RAID 6.
In quanto tale, discuteremo quali sono esattamente questi due livelli RAID, le loro principali somiglianze e differenze e quando utilizzarne uno in questo articolo.
Cos’è RAID 5?
Come affermato, diversi livelli RAID si concentrano sulla protezione dei dati e sul miglioramento delle prestazioni a vari livelli. RAID 5 fornisce entrambi questi elementi tramite la parità distribuita interleaved a blocchi.
Ciò significa che lo striping si verifica a livello di blocco. La dimensione di questi blocchi, nota anche come dimensione del blocco, è imposta dall’utente, ma in genere varia da 64 KB a 1 MB.
Inoltre, per ogni stripe, viene scritto un blocco di dati di parità. Questi blocchi di parità sono distribuiti nell’array invece di essere archiviati su un disco di parità dedicato.
Il motivo per cui RAID 5 gestisce la parità in questo modo più avanti nell’articolo, ma alla fine, ciò si traduce in uno spazio su disco riservato ai dati di parità.
Pro: Tolleranza ai guasti contro il guasto di un singolo disco Elevata capacità di archiviazione utilizzabile Elevata velocità di lettura Può essere impostato con un controller hardware o implementato tramite software Contro: Penalità sulle prestazioni di scrittura Può gestire un solo guasto del disco. Qualsiasi altro porta al fallimento dell’array Processo di ricostruzione rischioso
Cos’è RAID 6?
RAID 6 è molto simile a RAID 5, ma utilizza due blocchi di parità distribuiti su uno stripe anziché uno. Questo dettaglio cambia tutto, dal livello di tolleranza agli errori fornito dall’array alle prestazioni e allo storage utilizzabile.
La doppia parità di scrittura rende l’array molto più affidabile ma, allo stesso modo, anche le prestazioni di scrittura subiscono il doppio della penalità. Tuttavia, le prestazioni in lettura sono eccellenti, proprio come RAID 5.
Pro: Tolleranza ai guasti contro due guasti del disco Ottime prestazioni in lettura La ricostruzione dopo un guasto del disco è più sicura Svantaggi: Maggiore sovraccarico delle prestazioni di scrittura Due dischi di spazio necessario per la parità
RAID 5 Vs RAID 6 – Principali differenze
RAID 5 e 6 differiscono principalmente per il fatto che RAID 6 utilizza due blocchi di parità per stripe, mentre RAID 5 ne usa solo uno. Ma come affermato, questo porta anche a una serie di altre differenze, che tratteremo nelle sezioni seguenti.
Tolleranza agli errori
La prima cosa che influisce sul conteggio dei blocchi di parità è il livello di tolleranza agli errori. In un array RAID 5, viene scritto un blocco di dati di parità per ogni stripe. In caso di guasto del disco, i dati persi possono essere ricalcolati utilizzando i dati di parità ei dati sugli altri dischi nell’array.
In sostanza, questo significa che un array RAID 5 può gestire un guasto del disco senza alcuna perdita di dati. Di solito, comunque. Questa tolleranza agli errori è stata la ragione per cui RAID 5 è stato molto popolare fino agli anni 2010. Al giorno d’oggi, tuttavia, RAID 5 viene utilizzato raramente poiché la sua affidabilità non è più all’altezza. Ciò è dovuto al modo in cui la maggior parte dei controller RAID hardware gestisce le ricostruzioni.
Se il controller rileva un errore di lettura irreversibile (URE) durante la ricostruzione, in genere contrassegnerà l’intero array come non riuscito per prevenire un ulteriore danneggiamento dei dati. A meno che tu non disponga di backup o prevedi di ripristinare i dati da singoli dischi, i dati andranno persi.
Le dimensioni degli HDD sono cresciute in modo esponenziale negli ultimi due decenni, ma i miglioramenti della velocità di lettura/scrittura sono stati molto più moderati. In sostanza, le dimensioni degli array sono aumentate a velocità molto maggiori rispetto alle velocità di trasferimento dei dati, il che significa che i tempi di ricostruzione hanno iniziato a diventare molto lunghi.
A seconda della configurazione, la ricostruzione dell’array dopo un guasto del disco potrebbe richiedere alcune ore. di oggi. Tali tempi di ricostruzione significavano una maggiore possibilità di incontrare URE durante la ricostruzione, il che si traduce in una maggiore possibilità di guasto dell’intero array.
Negli ultimi anni, i tassi di occorrenza degli URE negli HDD sono diminuiti in modo significativo grazie ai miglioramenti tecnologici. Per questo motivo, RAID 5 viene ancora utilizzato qua e là. Ma il consenso generale del settore è di optare ancora per RAID 6 o altri livelli, e per una buona ragione.
In RAID 6, i dati di parità vengono scritti due volte per stripe. Ciò significa che un array RAID 6 può sostenere fino a due guasti del disco senza perdita di dati. Ciò rende RAID 6 molto più affidabile e quindi più adatto per array più grandi con dati importanti.
Prestazioni di scrittura
Un array RAID 5 deve leggere i dati, calcolare la parità, scrivere i dati e quindi la parità. Per questo motivo, RAID 5 subisce una penalità sui carichi di lavoro che coinvolgono le scritture.
RAID 6 prevede il calcolo e la scrittura della parità due volte, il che è ottimo per l’affidabilità, ma significa anche che subisce il doppio del sovraccarico per le operazioni di scrittura.
Per dimensioni I/O più piccole ( tipicamente 256 KB e meno), RAID 5 e 6 hanno prestazioni di scrittura molto comparabili. Ma con dimensioni I/O maggiori, RAID 5 è decisamente superiore.
Numero di dischi
RAID 5 richiede due dischi per lo striping e un disco di spazio per memorizzare i dati di parità. Ciò significa che un array RAID 5 richiede almeno 3 unità disco.
RAID 6 è simile, ma richiede un minimo di 4 dischi perché i dati di parità occupano due dischi di spazio.
Archiviazione utilizzabile
In un array RAID 5, la memoria utilizzabile può essere calcolata con (N – 1) x (dimensione disco più piccola), dove N è il numero di unità disco. Ad esempio, di seguito abbiamo mostrato un array RAID 5 con tre dischi da 1 TB. Viene utilizzato uno spazio su disco per memorizzare i dati di parità e, poiché la dimensione del disco più piccola è 1 TB, lo spazio utilizzabile arriva a 2 TB.
È importante provare a utilizzare dischi della stessa dimensione, altrimenti il disco più piccolo creerebbe un collo di bottiglia che si traduce in molto spazio inutilizzabile. L’esempio seguente mostra lo stesso scenario, in cui il disco da 500 GB ha reso inutilizzabili 1,5 TB.
In un array RAID 6, lo spazio di archiviazione utilizzabile viene calcolato con (N – 2) x (dimensione del disco più piccola). Ancora una volta, è importante utilizzare dischi della stessa dimensione per garantire che non vi sia spazio inutilizzabile nell’array.
Calcolo della parità
In RAID 5, viene eseguita un’operazione XOR su ogni byte di dati per calcolare le informazioni di parità in RAID 5 Ad esempio, supponiamo che il primo byte di dati in un array a 4 dischi sia simile a questo:
A1 – 11010101
A2 – 10001100
A3 – 10101100
Se eseguiamo un’operazione XOR sulle prime due strisce (A1 e A2) e poi facciamo lo stesso con l’uscita e la terza striscia (A3), l’uscita è l’informazione di parità (Ap). In questo caso, il suo valore è 11110101.
Quando un disco (ad esempio, Disco 1) si guasta, ecco cosa succede. Innanzitutto, A2 XOR A3 ci fornisce l’output 00100000. Quando utilizziamo questo output in un’operazione XOR con Ap, otteniamo 11010101 come risultato, che sono i dati persi.
00100000
11110101
11010101
Questo è fondamentalmente il modo in cui i dati di parità vengono calcolati e utilizzati per ricalcolare i dati persi in RAID 5.
RAID 6 è molto più complesso poiché calcola la parità due volte. A seconda della configurazione, questo viene implementato in vari modi, come il calcolo dei dati del doppio controllo (parità e Reed–Solomon), i dati del controllo della doppia parità ortogonale, la parità diagonale, ecc.
RAID Controller
RAID 5 può essere implementato sia tramite mezzi hardware che software. Il primo ovviamente prevede l’utilizzo di un controller RAID hardware dedicato. Poiché RAID 5 richiede il calcolo della parità, questo è il percorso consigliato.
Questo è particolarmente importante in alcuni casi, come con un NAS, in cui il processore non è abbastanza potente per gestire i calcoli senza creare un collo di bottiglia significativo.
Sebbene non sia l’ideale per motivi di prestazioni, RAID 5 può essere configurato anche tramite soluzioni software. Ad esempio, Windows ti consente di raggruppare i tuoi dischi utilizzando la funzione degli spazi di archiviazione. Puoi anche creare un volume RAID 5 tramite Gestione disco.
RAID 6, invece, richiede un controller RAID hardware. Questo perché i calcoli polinomiali eseguiti per calcolare il secondo livello di parità sono piuttosto intensivi per il processore.
RAID 5 e RAID6 sono simili?
Dovrebbe essere evidente a questo punto che mentre RAID 5 e 6 presentano alcune differenze chiave, sono anche simili in molti modi. Per cominciare, a differenza di RAID 1, RAID 5 e 6 forniscono la tolleranza agli errori attraverso la parità invece del mirroring.
In particolare, utilizzano la parità distribuita, che è diversa dai dischi di parità dedicati utilizzati da RAID 2, 3 e 4. Con la parità distribuita, non devi preoccuparti dei colli di bottiglia come con una singola parità disco.
Sia RAID 5 che 6 hanno eccellenti prestazioni di lettura grazie allo striping dei dati. Ma allo stesso modo, entrambi subiscono anche penalità sulle prestazioni di scrittura, anche se in misura diversa.
Che cosa c’è di buono in RAID 5?
RAID 5 offre un buon mix di spazio di archiviazione utilizzabile , protezione dei dati e prestazioni. Puoi anche configurarlo con un minor numero di dischi, il che lo rende un’opzione efficiente dal punto di vista del budget.
Se vuoi pensare in termini di prestazioni, RAID 5 è più adatto per i carichi di lavoro che coinvolgono principalmente operazioni di lettura come i server di posta elettronica.
Per quanto riguarda la tolleranza agli errori, abbiamo già trattato come RAID 5 è diventato meno affidabile nel corso degli anni. Va ancora bene per array di piccole dimensioni, ma con array più grandi, dove c’è una maggiore possibilità di ricostruzioni non riuscite, non consigliamo RAID 5.
Quando è meglio RAID 6?
L’affidabilità di RAID 6 va a scapito delle prestazioni di scrittura e dello spazio di archiviazione utilizzabile. Tuttavia, questa leggera disparità vale senza dubbio la pena quando i dati sui dischi sono importanti.
RAID 6 non è il migliore per array più piccoli (ad es. 4 dischi), poiché una parte significativa dello spazio di archiviazione viene persa alla ridondanza. Se è richiesta la ridondanza in piccoli array, RAID 5 o qualcosa come RAID 10 sarebbe meglio.
Invece, RAID 6 è più adatto per array più grandi dove c’è la possibilità di perdere molti più dati se l’impostazione non è t affidabile.
Verdetto finale: RAID 5 Vs RAID 6
RAID 5 non è completamente inaffidabile ed è ancora utilizzabile per array più piccoli. Ma con dati davvero critici, ti consigliamo di dare la priorità alla protezione rispetto a differenze minori di prestazioni, ed è qui che il RAID 6 prende la torta.
Indipendentemente dal livello RAID scelto, tuttavia, è importante capirlo RAID non è un backup. La ridondanza del RAID protegge solo dai guasti del disco. Anche un array RAID 6 può guastarsi durante le ricostruzioni.
Se i dati sui dischi sono abbastanza importanti da consentirti di utilizzare RAID 6 o altre versioni”affidabili”, non devi eseguire backup e pattugliare le letture con leggerezza, o. Infine, per ricapitolare, ecco le principali differenze tra RAID 5 e RAID 6: