Diferentes níveis de RAID oferecem diferentes benefícios. Alguns oferecem ganhos de desempenho agrupando capacidade de armazenamento e E/S de leitura/gravação, enquanto outros protegem contra falhas de hardware por meio de redundância de dados.

Entre esses níveis, RAID 5 e 6 têm sido dois dos mais populares em nos últimos tempos, pois oferecem uma combinação de desempenho e segurança. Devido às várias semelhanças, pode ser confuso descobrir quando é melhor usar RAID 5 versus RAID 6. 

Assim, discutiremos o que são exatamente esses dois níveis de RAID, suas principais semelhanças e diferenças e quando usar qualquer um neste artigo.

O que é RAID 5?

Como dito, diferentes níveis de RAID se concentram na proteção de dados e na melhoria do desempenho em graus variados. O RAID 5 fornece ambos por meio de paridade distribuída intercalada por blocos.

Isso significa que a distribuição ocorre no nível do bloco. O tamanho desses blocos, também conhecido como tamanho do bloco, é definido pelo usuário, mas normalmente varia de 64 KB a 1 MB.

Além disso, para cada faixa, um bloco de dados de paridade é gravado. Esses blocos de paridade são espalhados pelo array em vez de serem armazenados em um disco de paridade dedicado.

Vamos abordar por que o RAID 5 lida com paridade como esta mais adiante no artigo, mas, em última análise, isso resulta em um disco de espaço reservado para dados de paridade.

Prós: Tolerância a falhas contra falha de disco único Alta capacidade de armazenamento utilizável Alta velocidade de leitura Pode ser configurado com um controlador de hardware ou implementado por meio de software Contras: Penalidade no desempenho de gravação Só pode lidar com uma falha de disco. Qualquer coisa mais leva à falha do array Processo de reconstrução arriscado

O que é RAID 6?

RAID 6 é muito parecido com RAID 5, mas usa dois blocos de paridade distribuídos em uma faixa em vez de um. Esse detalhe muda tudo, desde o nível de tolerância a falhas fornecido pelo array até o desempenho e armazenamento utilizável.

Gravar paridade duas vezes torna o array muito mais confiável, mas, da mesma forma, o desempenho de gravação também sofre o dobro da penalidade. No entanto, o desempenho de leitura, assim como o RAID 5, é excelente.

Prós: Tolerância a falhas contra duas falhas de disco Ótimo desempenho de leitura A reconstrução após a falha do disco é mais segura Contras: Maior sobrecarga de desempenho de gravação Dois discos de espaço necessário para paridade

RAID 5 Vs RAID 6 – Principais diferenças

RAID 5 e 6 diferem principalmente no fato de que o RAID 6 usa dois blocos de paridade por faixa, enquanto O RAID 5 usa apenas um. Mas, como afirmado, isso também leva a várias outras diferenças, que abordaremos nas seções a seguir.

Tolerância a falhas

A primeira coisa que a contagem de blocos de paridade afeta é o nível de tolerância a falhas. Em uma matriz RAID 5, um bloco de dados de paridade do tamanho de um bloco é gravado para cada faixa. Em caso de falha de disco, os dados perdidos podem ser recalculados usando os dados de paridade e os dados nos outros discos da matriz.

Essencialmente, isso significa que uma matriz RAID 5 pode lidar com uma falha de disco sem perda de dados. Normalmente, de qualquer maneira. Essa tolerância a falhas foi a razão pela qual o RAID 5 foi muito popular até a década de 2010. Atualmente, porém, o RAID 5 raramente é usado, pois sua confiabilidade não está mais à altura. Isso se deve ao modo como a maioria dos controladores RAID de hardware lida com reconstruções.

Se o controlador encontrar um erro de leitura irrecuperável (URE) durante a reconstrução, ele normalmente marcará a matriz inteira como falha para evitar mais corrupção de dados. A menos que você tenha backups ou planeje recuperar dados de discos individuais, os dados serão perdidos.

Os tamanhos de HDD cresceram exponencialmente nas últimas duas décadas, mas as melhorias na velocidade de leitura/gravação foram muito mais moderadas. Essencialmente, o tamanho dos arrays aumentou a taxas muito maiores do que as velocidades de transferência de dados, o que significava que os tempos de reconstrução começaram a ficar muito longos.

Dependendo da configuração, reconstruir o array após uma falha de disco pode levar horas a dias. Esses tempos de reconstrução significavam uma chance maior de encontrar UREs durante a reconstrução, o que se traduz em uma chance maior de todo o array falhar.

Nos últimos anos, as taxas de ocorrência de URE em HDDs caíram significativamente graças a melhorias tecnológicas. Devido a isso, o RAID 5 ainda é usado aqui e ali. Mas o consenso geral da indústria é ainda optar por RAID 6 ou outros níveis, e por um bom motivo.

No RAID 6, os dados de paridade são gravados duas vezes por faixa. Isso significa que uma matriz RAID 6 pode sustentar até duas falhas de disco sem perda de dados. Isso torna o RAID 6 muito mais confiável e, portanto, mais adequado para arrays maiores com dados importantes.

Desempenho de gravação

Um array RAID 5 deve ler os dados, calcular a paridade, gravar os dados e depois a paridade. Devido a isso, o RAID 5 sofre uma penalidade nas cargas de trabalho que envolvem gravações.

O RAID 6 envolve calcular e gravar paridade duas vezes, o que é ótimo para confiabilidade, mas também significa que sofre o dobro da sobrecarga para operações de gravação.

Para tamanhos de E/S menores ( normalmente 256 KB ou menos), RAID 5 e 6 têm desempenho de gravação muito comparável. Mas com tamanhos de E/S maiores, o RAID 5 é definitivamente superior.

Número de discos

O RAID 5 requer dois discos para distribuição e um disco de espaço para armazenar dados de paridade. Isso significa que uma matriz RAID 5 requer no mínimo 3 unidades de disco.

RAID 6 é semelhante, mas requer um mínimo de 4 discos porque os dados de paridade ocupam dois discos no espaço.

Armazenamento utilizável

Em uma matriz RAID 5, o armazenamento utilizável pode ser calculado com (N – 1) x (menor tamanho do disco), onde N é o número de unidades de disco. Por exemplo, mostramos uma matriz RAID 5 com três discos de 1 TB abaixo. Um disco de espaço é usado para armazenar dados de paridade e, como o menor tamanho de disco é de 1 TB, o espaço utilizável chega a 2 TB.

É importante tentar usar discos do mesmo tamanho, caso contrário, o menor disco criaria um gargalo que resulta em muito espaço inutilizável. O exemplo abaixo mostra o mesmo cenário, em que o disco de 500 GB resultou na inutilização de 1,5 TB.

Em uma matriz RAID 6, o armazenamento utilizável é calculado com (N – 2) x (menor tamanho do disco). Mais uma vez, é importante usar discos do mesmo tamanho para garantir que não haja espaço inutilizável na matriz.

Cálculo de paridade

No RAID 5, uma operação XOR é executada em cada byte de dados para calcular as informações de paridade no RAID 5. Por exemplo, digamos que o primeiro byte de dados em uma matriz de 4 discos se pareça com isto:

A1 – 11010101
A2 – 10001100
A3 – 10101100

Se realizarmos uma operação XOR nas duas primeiras faixas (A1 e A2) e depois fizermos o mesmo com a saída e a terceira faixa (A3), a saída é a informação de paridade (Ap). Nesse caso, seu valor é 11110101.

Quando qualquer disco (por exemplo, Disco 1) falha, eis o que acontece. Primeiro, A2 XOR A3 nos dá a saída 00100000. Quando usamos essa saída em uma operação XOR com Ap, obtemos 11010101 como resultado, que são os dados perdidos.

00100000
11110101
11010101

É basicamente assim que os dados de paridade são calculados e usados ​​para recalcular dados perdidos no RAID 5. 

O RAID 6 é muito mais complexo, pois calcula a paridade duas vezes. Dependendo da configuração, isso é implementado de várias maneiras, como computação de dados de verificação dupla (paridade e Reed–Solomon), dados de verificação de paridade dupla ortogonal, paridade diagonal etc.

Controlador RAID

O RAID 5 pode ser implementado por meio de hardware e software. O primeiro obviamente envolve o uso de um controlador RAID de hardware dedicado. Como o RAID 5 requer computação de paridade, esta é a rota recomendada.

Isso é especialmente importante em certos casos, como em um NAS, onde o processador não é poderoso o suficiente para lidar com os cálculos sem criar um gargalo significativo.

Embora não seja ideal por motivos de desempenho, RAID 5 também pode ser configurado usando soluções de software. Por exemplo, o Windows permite agrupar seus discos usando o recurso de espaços de armazenamento. Você também pode criar um volume RAID 5 por meio do Gerenciamento de disco.

O RAID 6, por outro lado, requer um controlador RAID de hardware. Isso ocorre porque os cálculos polinomiais realizados para calcular a segunda camada de paridade são bastante intensivos no processador.

O RAID 5 e o RAID6 são semelhantes?

Deve ser evidente neste ponto que, enquanto o RAID 5 e 6 têm algumas diferenças importantes, também são semelhantes em muitos aspectos. Para iniciantes, ao contrário do RAID 1, o RAID 5 e 6 fornecem tolerância a falhas por meio de paridade em vez de espelhamento.

Especificamente, eles usam paridade distribuída, que é diferente dos discos de paridade dedicados usados ​​pelo RAID 2, 3 e 4. Com a paridade distribuída, você não precisa se preocupar com gargalos como com uma única paridade disco.

Tanto o RAID 5 quanto o 6 têm excelente desempenho de leitura graças à distribuição de dados. Mas, da mesma forma, ambos também sofrem penalidades no desempenho de gravação, embora em graus variados.

O que há de bom no RAID 5?

O RAID 5 oferece uma boa combinação de armazenamento utilizável , proteção de dados e desempenho. Você também pode configurá-lo com menos discos, o que o torna uma opção econômica.

Se você quiser pensar em termos de desempenho, o RAID 5 é mais adequado para cargas de trabalho que envolvem operações de leitura principal, como servidores de e-mail.

Quanto à tolerância a falhas, já abordamos como o RAID 5 se tornou menos confiável ao longo dos anos. Ainda é bom para arrays de pequeno porte, mas com arrays maiores, onde há uma chance maior de reconstruções com falha, não recomendamos o RAID 5.

Quando o RAID 6 é melhor?

A confiabilidade do RAID 6 tem o custo de desempenho de gravação e armazenamento utilizável. No entanto, essa pequena disparidade sem dúvida vale a pena quando os dados nos discos são importantes.

O RAID 6 não é o melhor para arrays menores (por exemplo, 4 discos), pois uma parte significativa do armazenamento é perdida à redundância. Se a redundância for necessária em arrays pequenos, RAID 5 ou algo como RAID 10 seria melhor.

Em vez disso, o RAID 6 é mais adequado para arrays maiores, onde há uma chance de perder muito mais dados se a configuração não for adequada t confiável.

Veredicto Final – RAID 5 Vs RAID 6

RAID 5 não é totalmente não confiável, e ainda é utilizável para arrays menores. Mas com dados realmente críticos, você vai querer priorizar a proteção sobre pequenas diferenças de desempenho, e é aí que o RAID 6 leva o bolo.

Independentemente do nível de RAID escolhido, é importante entender que RAID não é um backup. A redundância do RAID protege apenas contra falhas de disco. Até mesmo uma matriz RAID 6 pode falhar durante as reconstruções.

Se os dados nos discos forem importantes o suficiente para você usar RAID 6 ou outras versões’confiáveis’, então você não deve levar backups e leituras de patrulha levianamente, qualquer. Por fim, para recapitular, aqui estão as principais diferenças entre RAID 5 e RAID 6:

RAID 5RAID 6Camadas de paridade >Os dados de paridade são calculados uma vez.Os dados de paridade são calculados duas vezes.Tolerância a falhasPode tolerar uma falha de disco.Pode tolerar duas falhas de disco.Desempenho de gravaçãoO desempenho de gravação sofre algumas penalidades. o desempenho sofre uma sobrecarga comparativamente maior.Discos mínimosSão necessários pelo menos 3 discos. São necessários pelo menos 4 discos.Armazenamento utilizávelOferece maior armazenamento utilizável.O armazenamento utilizável é comparativamente menor.Cálculo de paridadeA paridade é calculada por meio de uma operação XOR simples. A paridade é calculada usando XOR junto com outros algoritmos complexos.ImplementaçãoPode ser implementado usando soluções de hardware ou software.Requer controlador RAID de hardware dedicado.

Categories: IT Info