Système de stockage RAID extensible

1

Je construis actuellement une unité de stockage pour notre bureau. C'est un budget plutôt faible pour le moment, mais il doit être extensible.

fondamentalement, nous avons une énorme base de données qui va s’agrandir considérablement au cours des prochains mois. Par conséquent, idéalement, nous aimerions simplement lancer des disques durs sur notre nouveau serveur.

Nous n'avons pas encore acheté le serveur, mais passons par quelques détails. Cependant, j'aimerais d'abord obtenir une réponse à une question.

Est-il facile d'étendre les systèmes RAID existants?

Nous allons commencer par deux disques durs WD noir de 4 To. Mais après environ un mois, nous devrons ajouter deux autres disques de 4 To. Le serveur que nous allons avoir a 12 baies.

La mise en miroir est importante. Cependant, RAID 1 ne fonctionne qu'avec 2 disques. Le Raid 10 nous permettrait déjà de refléter un RAID 0. Et d'après ce que j'ai vu, même le raid 10 peut être installé avec deux disques. Cependant, que se passe-t-il après cela? Existe-t-il une recommandation pour réaliser un système RAID flexible?

Sur la couche de système d'exploitation, je voudrais juste construire un LVM, qui reconnaît une fois que de l'espace est ajouté au "disque" afin qu'il puisse être étendu. Mais en réalité, il repose sur plusieurs disques gérés par le contrôleur RAID.

Richard
la source
Quel système de base de données utilisez-vous? Microsoft SQL vous permet d'ajouter plus de fichiers de données à mesure que vous ajoutez plus de volumes logiques et physiques. Il va ensuite redistribuer lentement les données pour les équilibrer sur tous les volumes.
James

Réponses:

2

Il existe de nombreuses options offrant différents degrés de résilience, d’efficacité du disque et de facilité d’utilisation. Voici quelques-uns:

RAID 0 & 1 RAID 0 et 1 sont tout de suite une question, RAID 0 n'offre aucune redondance (en fait, il augmente les risques) et RAID 1 est limité - comme vous l'avez mentionné - à la taille maximale d'un disque.

RAID 5 est une option et vous ne perdez qu'un disque pour la parité; bien que cela soit doux-amer car plus vous avez de disques, plus vous avez de chances de trouver une erreur sur 2 (ou plus) disques (et vous êtes foutu si cela se produit). Les vitesses d'écriture font souvent défaut. Minimum 3 disques pour commencer. L'expansion prend du temps et présente un risque élevé d'échec total.

RAID 6 est une option plus résiliente, identique à RAID 5 à la différence qu'il utilise 2 x disques pour la parité, vous pouvez donc perdre 2 x disques en cas d'échec tout en pouvant être reconstruit. Les vitesses d'écriture font souvent défaut. Minimum 4 disques pour commencer. L'extension prend beaucoup de temps et présente un risque d'échec total inférieur à RAID5, mais non négligeable.

RAID 10 est l'option la plus résistante de tous les RAID et également la location efficace, car elle utilise la moitié de tous les disques présents pour la mise en miroir. L'un des principaux avantages de RAID 5 et 6 est que les vitesses d'écriture sont souvent considérablement améliorées avec chaque disque ajouté (au lieu de baisser les performances) - cela peut être essentiel en fonction du type de base de données que vous implémentez. Minimum 4 disques pour commencer, en ajoutant 2 disques à la fois. L'expansion est probablement la plus rapide avec le risque minimum associé.

RAID 50/60 est le juste milieu entre RAID 5/6 et RAID 10 - offre une meilleure efficacité d'utilisation du disque que le RAID 10, mais nécessite de nombreux disques pour démarrer (minimum 6) et offre également de meilleures performances que les systèmes RAID de base. L’expansion prend beaucoup de temps. Le risque dépend du nombre de disques présents dans la matrice, mais il se situe entre RAID 10 et 5/6 (pondéré vers 5/6).

LVM Je ne m'en sers pas beaucoup, alors je laisserai cette avenue à quelqu'un d'autre pour commenter.

RAID basé sur un système de fichiers BTRFS et ZFS peuvent tous deux effectuer un RAID 0,1,5 de manière transparente sur des disques sans recourir à la gestion RAID Linux. Ajouter / supprimer / modifier des ensembles de piles est facile (bien que prenant beaucoup de temps, comme le fait RAID). ZFS a l'avantage d'être testé et testé pendant de nombreuses années, alors que BTRFS est toujours un système de fichiers émergent.

Conclusion:

Le RAID Linux est un peu plus tolérant que le RAID matériel, où les RAID 5/6/50/60 sont impliqués Linux RAID peut vous rendre la vie un peu plus facile si les choses tournent mal (comme perdre deux disques sur une matrice RAID 5, vous pouvez quand même assembler et tentez de récupérer, alors que la plupart des HBA refuseront carrément). RAID 10 avec matériel Le RAID constitue généralement le pari le plus sûr en termes de résilience, de débit d'E / S et de temps d'extension. Alors mets-le dans mon top 2:

Si le débit d'E / S n'est pas une priorité élevée: * Linux RAID 5, mais sauvegardez régulièrement vos données ailleurs pour compenser le risque. L’expansion est aussi simple qu’une commande d’une ligne, bien que cela prenne un certain temps.

Si le débit d'E / S est une priorité: * Matériel RAID 10, la planification de la sauvegarde de vos données peut être quelque peu assouplie. L’extension dépend du type de RAID matériel, mais son initialisation ne prend pas autant de temps.

Alitch
la source
Cela ne semble pas répondre à la question.
Michael Hampton
Ajout de commentaires qui traitent la question plus directement.
Litch
2

Il y a quelques points sur lesquels j'aimerais insister: tout d'abord, j'essayerais d'utiliser un périphérique de stockage dédié si possible. Le matériel conçu dans un but spécifique a tendance à être plus adapté que les serveurs génériques. Cela dit, je comprends que si le budget est bas, il n’y aura peut-être aucune chance d’obtenir une petite matrice de disques.

Par conséquent, si vous devez utiliser un serveur normal, vous pouvez généralement vous procurer des contrôleurs RAID matériels avancés permettant l’extension de disque logique. Si vous en utilisez un, il vous suffit de ré-analyser le bus et de développer le système de fichiers une fois que le contrôleur a fini de reconstruire le tableau (à condition qu'il n'y ait pas de table de partition). S'il s'agit d'une opération non perturbante, même si une stratégie de sauvegarde est fortement recommandée. N'oubliez pas que la reconstruction de la matrice affectera les performances. Cependant, même si cela est possible, je ne recommanderais pas de dépendre uniquement du contrôleur de serveur. Je développerai cela plus tard.

Deuxièmement, il semble que nous examinions ici un facteur de capacité, l’espace disque. Qu'en est-il de la performance? L'utilisation de disques 4 To dans une configuration RAID5 ou RAID6 va vous donner un très mauvais accès aléatoire / écriture. Dans la gamme de 10 ou 20 IOPS / TB. Si votre base de données n'est pas fréquemment consultée, ce serait correct, mais si vous avez un besoin dans ce sens, cela peut poser problème.

Compte tenu de ces deux points, mon conseil serait le suivant:

  • Séparez les volumes (disques logiques) en fonction des besoins de performances
  • Utilisez un contrôleur de réseau de disques avancé offrant plusieurs baies en mode RAID5, RAID6; cache sauvegardé par batterie et disques de rechange.
  • Pour les ensembles de données nécessitant des performances élevées, j'utiliserais un grand ratio de piles par To et de disques rapides (SAS?) Et une configuration RAID avec une petite pénalité RAID (RAID10).
  • Pour les ensembles de données sans exigences de performances, j'utiliserais un ratio de broches faible par TB. Les disques de capacité seraient idéaux ici (2, 3, 4 To NLSAS) dans une configuration RAID5 ou RAID6. Je me concentrerais sur la création des tableaux complets à partir du jour 0.
  • Pour étendre vos lecteurs logiques, je créerais de nouveaux tableaux au niveau du contrôleur et les gérerais avec LVM.

Par exemple. Si vous avez besoin de 300 Go de stockage performant et de 2 To de capacité de stockage, je créerais deux disques logiques à l'aide du contrôleur de matrice:

  • Performances: disques RAID 1 SAS 1 x 2x600 Go
  • Capacité: RAID5, 3 + 1 disques NLSAS 2 To

Tous deux gérés via LVM (groupes de volumes distincts)

Si j'avais besoin de plus d'espace disque "Capacité", j'acquérirais 4 disques NLSAS supplémentaires et créerais un nouveau groupe 3 + 1 et sa capacité serait ajoutée au groupe Volume de capacité. Si vous sortez des baies de disques, certains fournisseurs ont des étagères JBOD que vous pouvez connecter au même contrôleur de disque et ils seront gérés par celui-ci.

Les largeurs exactes RAID5 et RAID6 seront déterminées par vos besoins et les capacités de votre contrôleur. Veuillez consulter le manuel pour voir les recommandations du fournisseur dans ce sens. Les configurations fréquemment recommandées sont RAID5 en 3 + 1 et RAID6 en 6 + 2.

Dernier point, mais non le moindre, surveillez vos défaillances de disque et consultez le nombre de disques de secours.

J'espère que ça aide!

c-garcia
la source