RAID 6 contre RAID 10? Lequel choisiriez-vous

11

Mon choix serait RAID 6 pour un serveur de fichiers car vous pouvez perdre deux disques et peu importe le jeu de deux qui peut mourir. D'après ce que je comprends avec RAID 10, vous pouvez perdre deux disques, mais s'ils se trouvent sur la même matrice RAID 1, vous n'avez pas de chance? Aucune suggestion? Serveur de fichiers de base avec environ 200 Go de données et il agirait comme un point de sauvegarde unique pour d'autres postes de travail et serveurs.

dasko
la source
«point de sauvegarde unique» désigne un référentiel de sauvegardes provenant de partout sur le réseau. c'est votre seul point que vous sauvegardez ensuite sur un support. je ne sauvegarderais jamais un serveur puis un autre puis un autre. cela fonctionnerait si vous n'en aviez qu'un, nous en avons environ 10.
Si votre véritable objectif est d'avoir un endroit «sûr» pour stocker les sauvegardes, alors j'achèterais simplement une pile de disques, puis j'échangerais les disques quotidiennement et mettrais les inutilisés dans un pare-feu, ou mieux encore, hors site dans un endroit sûr . Le RAID ne contribuera aux performances et à la disponibilité qu'en cas de défaillance d'un seul disque, mais pas si le serveur fond ou si le bâtiment brûle. Dans le passé, cela se faisait avec des lecteurs de bande, mais de nos jours, les disques supplémentaires sont probablement un moyen beaucoup plus économique et plus facile à gérer.
Jed Daniels
dasko, l'un des éléments ci-dessous répond-il à votre question?
James Cape

Réponses:

12

Cela dépend de ce que vous essayez de faire. Alors que Raid 10 vous donnerait des lectures et des écritures plus rapides des deux, comme vous l'avez dit, il est possible de tout perdre si vous perdez les deux mauvais disques. Mais sur des baies de disques plus grandes, vous pourriez perdre exactement la moitié des disques et conserver des opérations complètes. Mais avec Raid 6, vos écritures pourraient être un peu plus lentes b / c de la somme de contrôle supplémentaire. Mais vous pourriez perdre deux disques et ne perdre aucune donnée.

Je pense qu'un autre point important à retenir est que Raid n'est pas une sauvegarde de données . Donc, la principale chose à considérer est que le RAID est la disponibilité du serveur. Ne pas conserver les données intactes.

Je pense qu'en fin de compte, c'est une question de préférence. J'irais personnellement avec Raid 10; Pour les baies très volumineuses, vous pourrez peut-être extraire un RAID 50 ou 60. Là où le disque dans l'ensemble agrégé par bandes pourrait être protégé avec le raid 5 ou le raid 6.

Quelques bonnes lectures:

Ryan Gibbons
la source
2
Bien que RAID ne soit pas une sauvegarde .... dans ce cas, je pense que sa définition de la sauvegarde est solide. Comme les données d'origine vivent sur les postes de travail et autres serveurs et sont sauvegardées sur ce serveur. Ce qui arrive à utiliser RAID pour aider à la disponibilité.
3dinfluence
5
Permettez-moi d'ajouter alors: la sauvegarde en ligne n'est pas une sauvegarde. S'il s'agit d'une sauvegarde, elle doit être stockée sur bande / disque et placée dans un coffre-fort quelque part loin du reste des systèmes. RAID n'y aide pas.
2010
1
Je pense que cela dépend aussi des types de disques utilisés, mais pour un serveur de fichiers de base, RAID 6 est suffisant. Réservez RAID 10 pour le serveur SQL à charge élevée.
murisonc
4
Les systèmes de sauvegarde @cypher Online ont deux propriétés très désagréables: 1: Il est possible d'effacer toute la sauvegarde par des accidents ou des bogues dans le système de sauvegarde, souvent sans s'en rendre compte. La vérification et la restauration à partir d'un système hors ligne se font en lecture seule, ce qui réduit les risques pour vos sauvegardes. 2: Une sauvegarde en ligne n'est probablement pas dans un coffre-fort ignifuge sans connexion externe. Une fois qu'un électricien a alimenté 480 V dans votre salle des serveurs, vous apprenez cette leçon.
pehrs
2
Le principal problème du raid est qu'il signifie que les lecteurs sont constamment utilisés et sujets à l'usure, ce qui les rend beaucoup plus susceptibles d'échouer qu'un lecteur hors ligne ou une sauvegarde sur bande. De plus, il ne protège pas contre la corruption des données ou les suppressions répliquées. Les bandes / lecteurs hors ligne peuvent avoir leurs propres problèmes, le seul moyen à toute épreuve est à plusieurs étages.
JamesRyan
7

[Je suppose que vous êtes à l'aise avec les performances de RAID6 et que vous ne vous souciez que des échecs]

J'utilise les chiffres de http://en.wikipedia.org/wiki/Standard_RAID_levels , et je suis nul en mathématiques, donc cela peut être faux. Supposons que 5% de vos disques meurent dans un délai d'un an.

La probabilité d'une pure et simple RAID1 double élément de mourir est la probabilité d'un entraînement donné la mort, au carré: P(R1) = P(drive)^2.

Ainsi, avec le taux d'échec de 5%, vous vous retrouvez avec:

P(R1) = 0.005^2 = 0.0025 = 0.25%

(Voici où je ne suis pas sûr des mathématiques --- cela a du sens, mais cela ne veut rien dire)

Ainsi, les chances de perdre un membre R1 donné sont de 0,25% par an, mais vous en avez plusieurs regroupés, et si l'un d'eux meurt, votre tableau est mort. de sorte que vous devez brancher le numéro P (R1) dans le calcul de l' échec R0: P(R10) = 1 - (1 - P(R1))^(n_R1). Supposons que vous ayez 8 disques au total (et ne les remplacez pas en cas de panne), donc une bande sur 4 R1:

P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%

Vous avez donc environ 1% de chances de perdre un RAID10 avec 8 disques avec 5% de risques de panne par an.

Simplement, la probabilité d'échec de RAID6 est la probabilité de la mort d'un disque donné, en cubes (car vous devez perdre trois disques pour qu'il tombe en panne), par exemple:

P(drive)^3 = (5%)^3 = 0.0125%

Ainsi, pour le scénario "plusieurs lecteurs en train de mourir", RAID6 est environ 1/80 aussi susceptible d'échouer que RAID10 avec les mêmes lecteurs.

Malheureusement, la vie est compliquée et vous devez faire face à des secteurs qui tournent mal. Il est tout à fait probable que des erreurs aléatoires soient introduites dans vos disques qui passent inaperçues. Je ne copie plus seulement wikipedia ici, mais je suppose que la probabilité qu'un mauvais secteur apparaisse sur un lecteur donné est P(bs) = P(UBER) * bits_written. Si cela se produit, la récupération après une panne de disque est impossible dans un R1 et plus délicate dans un R6.

Bien sûr, tout cela est théorique si le contrôleur ou le pilote RAID6 est bogué et introduit des erreurs dans vos données ou corrompt votre matrice :-)

James Cape
la source
2
Ce calcul est bon, mais lors d'une reconstruction, les lecteurs de parité / miroir sont plus touchés que tout autre et sont donc beaucoup plus susceptibles d'échouer que le taux d'échec moyen. Ainsi, RAID10 est encore plus susceptible de perdre ce 2e disque spécifique.
JamesRyan
1
la parité / miroir est de 1 disque en RAID10 mais répartie sur tous les disques en RAID6
JamesRyan
2
Une autre considération est que les disques achetés par lots ont tendance à mourir par lots, ce qui rend les défaillances de plusieurs disques plus courantes que les calculs simples ne le suggèrent. (Une leçon apprise à la dure!)
mattdm
1
Alors que RAID10 est généralement construit en utilisant uniquement des paires RAID1 à 2 disques, ce n'est pas toujours le cas. Linux mdadmpermet de créer une disposition RAID10 avec n'importe quel niveau de redondance (2, 3, 4, ...), tant qu'il est inférieur au nombre de disques dans la matrice (il est donc possible de créer un RAID10 avec deux copies de données avec seulement 3 disques). L' --layout=option permet de définir le nombre de copies.
Hubert Kario
2

Pour une station de travail ou un serveur à forte intensité de processeur, je voterais pour RAID 10 pour de meilleures performances de lecture / écriture.

Pour un serveur de stockage de données, j'irais avec RAID 6.

Si possible, j'utiliserais le RAID 10 sur ma station de travail et mes serveurs et j'utiliserais un RAID 6 sur un serveur de fichiers pour conserver les fichiers de sauvegarde.

wag2639
la source
0

Les serveurs de fichiers sont généralement plus liés par la liaison réseau. Donc, pour un serveur de fichiers typique, j'opterais pour la protection supplémentaire qu'offre RAID6 car, en fin de compte, la vitesse à travers le réseau sera votre goulot d'étranglement.

Si vous exécutez quelque chose de local sur le serveur comme une grande base de données ou des machines virtuelles, j'opterais pour la configuration RAID10.

3dinfluence
la source
0

Raid6 est beaucoup plus sûr que R1. La probabilité est de 5% que le disque tombe en panne pendant un an. Raid6 échouera si 3 disques mourront le même jour. La probabilité est donc de 0,05 * 1/365 = 0,000014. Ainsi, la probabilité d'échouer Raid6 est de 2,6 E-12, ce qui est bien moins que la probabilité de gagner à la loterie. Si le disque tombe en panne dans la matrice Raid6, vous pouvez changer is et le contrôleur de raid commencera immédiatement à reconstruire la matrice raid. Il faut une application. 1 jour à f. ex. disque de 2 To reconstruit sur la baie Raid6. Ainsi, vous devez avoir des échecs pendant une journée ou même moins si vous utilisez un disque plus petit que 2 To.

Mais comme dit ici, gardez une vraie sauvegarde en continu. Un jour, votre source d'alimentation peut mourir et donner une tension supplémentaire à votre système et tous les disques durs migreront hors ligne après cela, juste comme ça (ou quelque chose de bizarre se produit, qui sait). Habituellement, cela ne se produit pas, mais si vous avez vraiment besoin de vos données, reprenez ailleurs que dans le tableau Raid.


la source