RAID (Redundant Array of Independent Disks), originalmente conhecido como Redundant Array of Inexpensive Disks, foi proposto pela primeira vez pelo professor DA Patterson da Universidade da Califórnia,Berkeley no artigo "Um caso de matriz redundante de discos baratos" em 1988Naquela época, os discos de grande capacidade eram caros, por isso a ideia básica do RAID era combinar organicamente vários discos de pequena capacidade e relativamente baratos para obter a capacidade,desempenho e fiabilidade equivalentes a discos caros de grande capacidade a um custo menorÀ medida que o custo e o preço dos discos continuavam a diminuir, o termo "barato" ficou sem significado, e o Conselho Consultivo do RAID (RAB) decidiu substituir "barato" por "independente".
Esta ideia de design do RAID foi rapidamente adotada pela indústria. A tecnologia RAID, como uma tecnologia de armazenamento de alto desempenho e altamente confiável, foi amplamente aplicada.tecnologias de espelhamento e paridade de dados para alcançar um elevado desempenho, fiabilidade, tolerância a falhas e escalabilidade. De acordo com as estratégias e arquiteturas de utilização ou de combinação destas três tecnologias,O RAID pode ser dividido em diferentes níveis para atender às necessidades de diferentes aplicações de dadosOs níveis RAID originais RAID1-RAID5 foram definidos no artigo de D. A. Patterson et al., e RAID0 e RAID6 foram ampliados desde 1988.Os fornecedores de armazenamento introduziram continuamente níveis RAID como o RAID7, RAID10/01, RAID50, RAID53 e RAID100, mas não existe um padrão unificado.e os quatro níveis, exceto o RAID2, foram definidos como padrões industriaisOs níveis de RAID mais utilizados no campo de aplicação real são RAID0, RAID1, RAID3, RAID5, RAID6 e RAID10.
Do ponto de vista da implementação, o RAID é dividido principalmente em três tipos: RAID de software, RAID de hardware e RAID híbrido.Todas as funções são concluídas pelo sistema operacional e CPU, e não há um chip de controle/processamento RAID independente e um chip de processamento I/O, de modo que a eficiência é a mais baixa.O RAID de hardware é equipado com um chip de controle/processamento RAID especial e um chip de processamento de E/S, bem como um buffer de matriz, e não ocupa recursos de CPU, mas o custo é muito alto. O RAID híbrido tem um chip de controle / processamento RAID, mas não possui um chip de processamento I / O, e precisa da CPU e dos programas de driver para completar,e seu desempenho e custo estão entre software RAID e RAID hardware.
Cada nível RAID representa um método e uma tecnologia de implementação, e não há distinção entre níveis altos e baixos.O nível RAID adequado e o método de implementação específico devem ser selecionados de acordo com as características das aplicações de dados de utilizador., e a disponibilidade, o desempenho e o custo devem ser compreensivamente considerados.
RAID, ou seja, Redundant Array of Independent Disks, é geralmente abreviado como disk array.que oferece um desempenho de armazenamento e uma tecnologia de redundância de dados mais elevados do que um único discoO RAID é uma tecnologia de gerenciamento de múltiplos discos que fornece custo-benefício, alta confiabilidade de dados e armazenamento de alto desempenho para o ambiente host.uma matriz de disco na qual parte do espaço de armazenamento físico é usada para registrar as informações redundantes dos dados do usuário armazenados no espaço restante. Quando um disco ou caminho de acesso falha, as informações redundantes podem ser usadas para reconstruir os dados do usuário.É também chamado de RAID (i.e, RAID0).
A intenção original do RAID era fornecer funções de armazenamento de ponta e segurança de dados redundantes para grandes servidores.O RAID é considerado um espaço de armazenamento composto por dois ou mais discos, e o desempenho de E/S do sistema de armazenamento é melhorado pela leitura e gravação de dados em vários discos simultaneamente.e até mesmo métodos de espelhamento, que aumentam muito a confiabilidade do sistema, e é de onde vem "Redundante".
Aqui precisamos mencionar JBOD (Just a Bunch of Disks). Inicialmente, JBOD foi usado para representar uma coleção de discos sem software de controle para fornecer controle coordenado,que é o principal fator que distingue o RAID do JBODAtualmente, JBOD muitas vezes se refere a uma caixa de disco, independentemente de fornecer funcionalidade RAID ou não.
Os dois principais objetivos do RAID são melhorar a confiabilidade dos dados e o desempenho de E/S. Na matriz de disco, os dados estão espalhados entre vários discos, mas para o sistema de computador,Parece um único disco.. A redundância é alcançada escrevendo os mesmos dados em vários discos (normalmente espelhando) ou escrevendo os dados de paridade calculados na matriz,para que a perda de dados não seja causada quando um único disco falhaAlguns níveis de RAID permitem que mais discos falhem ao mesmo tempo, como o RAID6, onde dois discos podem ser danificados ao mesmo tempo.o disco falhado pode ser substituído por um novo disco, e o RAID reconstruirá automaticamente os dados perdidos de acordo com os dados e dados de paridade nos discos restantes para garantir a consistência e integridade dos dados.Os dados estão espalhados e armazenados em vários discos diferentes no RAID, e a leitura e gravação simultânea de dados é muito melhor do que a de um único disco, de modo que maior largura de banda agregada de E/S pode ser obtida.a matriz de disco reduzirá o espaço de armazenamento total disponível de todos os discosPor exemplo, a utilização do espaço de armazenamento do RAID1 é de apenas 50%, e o RAID5 perderá a capacidade de armazenamento de um disco,e a utilização do espaço é (n-1)/n.
A matriz de discos pode garantir a operação contínua do sistema sem interrupção quando alguns discos (únicos ou múltiplos, dependendo da implementação) forem danificados.Durante o processo de reconstrução dos dados do disco falhado para o novo disco, o sistema pode continuar a funcionar normalmente, mas o desempenho será reduzido em certa medida.enquanto alguns apoiam troca quente, permitindo a substituição de unidades de disco sem desligar.e o sistema não pode ser desligado ou o tempo de desligamento deve ser o mais curto possívelEm geral, o RAID não pode substituir o backup de dados. É impotente para perda de dados causada por falhas não-disco, como vírus, destruição humana, exclusão acidental, etc. Neste momento,A perda de dados é relativa ao sistema operacionalPara o próprio sistema RAID, os dados estão intactos e não ocorreu nenhuma perda.Recuperação de desastres e outras medidas de proteção de dados são muito necessárias, que complementam o RAID e protegem a segurança dos dados em diferentes níveis para evitar a perda de dados.
Há três conceitos e tecnologias chave no RAID: espelhamento, striping de dados e paridade de dados.e por outro lado, pode ler dados de duas ou mais cópias simultaneamente para melhorar o desempenho de leitura.e leva mais tempo para garantir que os dados são escritos corretamente para vários discos. Data striping armazena fatias de dados em vários discos diferentes, e várias fatias de dados juntos formam uma cópia completa de dados,que é diferente das múltiplas cópias de espelhamento e é geralmente utilizado para considerações de desempenho. O striping de dados tem uma maior granularidade de simultânea. Ao acessar dados, é possível ler e escrever dados em diferentes discos ao mesmo tempo,obtendo assim uma melhoria muito significativa do desempenho de E/S. A paridade de dados usa dados redundantes para detecção e reparo de erros de dados. Os dados redundantes são geralmente calculados por algoritmos como código Hamming e operação XOR.A utilização da função de paridade pode melhorar consideravelmente a fiabilidadeNo entanto, a paridade de dados precisa ler dados de vários lugares e realizar cálculos e comparações, o que afetará o desempenho do sistema.Diferentes níveis de RAID adotam uma ou mais das três tecnologias acima para obter diferentes confiabilidades de dados, disponibilidade e desempenho de E/S. Quanto ao tipo de RAID (mesmo novos níveis ou tipos) a projetar ou que modo de RAID a adoptar,É necessário fazer uma escolha razoável com base na premissa de compreender profundamente os requisitos do sistema e avaliar de forma abrangente a fiabilidade, desempenho e custo para fazer uma escolha de compromisso.
-
Grande capacidade: Esta é uma vantagem óbvia do RAID. Ele expande a capacidade do disco, e o sistema RAID composto por vários discos tem um enorme espaço de armazenamento. Agora a capacidade de um único disco pode chegar a mais de 1 TB,Assim, a capacidade de armazenamento do RAID pode atingir o nível PBEm geral, a capacidade disponível do RAID é menor do que a capacidade total de todos os discos membros.Diferentes níveis de algoritmos RAID exigem uma certa sobrecarga de redundânciaSe o algoritmo e a capacidade do RAID forem conhecidos, a capacidade disponível do RAID pode ser calculada.A utilização da capacidade do RAID está entre 50% e 90%.
-
Alto desempenho: O elevado desempenho do RAID beneficia da tecnologia de striping de dados.e é frequentemente o gargalo do desempenho do sistema. Através do striping de dados, o RAID distribui os dados de E/S para cada disco membro, obtendo assim o desempenho agregado de E/S que é várias vezes maior do que o de um único disco.
-
Confiabilidade: Disponibilidade e confiabilidade são outras características importantes do RAID. Teoricamente, a confiabilidade de um sistema RAID composto por vários discos deve ser pior do que a de um único disco.Há uma suposição implícita aquiO RAID usa tecnologias de redundância de dados como espelhamento e paridade de dados para quebrar essa suposição.O espelhamento é a tecnologia de redundância mais primitiva., que copia completamente os dados de um determinado grupo de unidades de disco para outro grupo de unidades de disco para garantir que haja sempre uma cópia de dados disponível.Em comparação com a despesa geral de redundância de 50% do espelhamento, a paridade de dados é muito menor, e usa a informação redundante de paridade para verificar e corrigir os dados.A tecnologia de redundância do RAID melhora consideravelmente a disponibilidade e a fiabilidade dos dados, e garante que, quando vários discos falharem, os dados não serão perdidos e o funcionamento contínuo do sistema não será afetado.
-
GestãoNa verdade, o RAID é uma tecnologia de virtualização que virtualiza várias unidades de disco físicas em uma unidade lógica de grande capacidade.unidade de disco de grande capacidade rápida e fiávelDesta forma, os usuários podem organizar e armazenar os dados do sistema de aplicativos nesta unidade virtual.Uma vez que o RAID completou uma grande quantidade de trabalho de gestão de armazenamento internamente, o administrador só precisa gerenciar uma única unidade virtual, o que pode economizar muito trabalho de gerenciamento.O RAID pode adicionar ou excluir dinamicamente unidades de disco e realizar automaticamente verificação de dados e reconstrução de dados, o que pode simplificar consideravelmente o trabalho de gestão.