Dois-je «exécuter» un disque d'une nouvelle paire RAID 1 pour diminuer le risque d'un temps de défaillance similaire?

19

J'installe une matrice RAID1 de deux nouveaux disques durs de 4 To.

J'ai entendu quelque part auparavant, que la création d'une matrice RAID1 de nouveaux disques durs identiques achetés en même temps augmentait les chances de défaillance à un moment similaire.

J'envisage donc d'utiliser l'un des disques durs pour une période de temps (peut-être quelques semaines) seul, afin de réduire la probabilité de défaillance des deux dans un court laps de temps. (le lecteur inutilisé resterait déconnecté dans un tiroir)

Cela semble-t-il une approche raisonnable, ou suis-je plus susceptible de simplement perdre mon temps?

a_henderson
la source
2
C'est une affirmation souvent entendue, mais je n'ai encore vu aucune documentation à l'appui. Un risque bien plus réel est que l'un de vos disques puisse développer des secteurs défectueux, qui passent inaperçus pendant un certain temps. Mais une fois que l'autre disque tombe en panne, vous remarquerez ces secteurs défectueux lors de la reconstruction.
kasperd du
8
Si vous travaillez avec des dizaines de disques, il peut être utile d'envisager de vous approvisionner à partir de quelques lots. Pour un ensemble de deux disques, cela ne vaut pas la peine de le faire. Le taux d'échec n'est tout simplement pas similaire ou prévisible ... l'un pourrait durer 3 mois, l'autre pourrait durer 5 ans.
jlehtinen
Personnellement, je ne ferais pas de raid avec seulement deux disques. L'utilisation de plus de disques offre une meilleure capacité. Par exemple, 3 disques fourniraient 8 To de stockage total, contrairement à 2 disques, ce qui ne donne que 4 To. N'importe quel lecteur peut tomber en panne sur l'ensemble de trois, et s'ils proviennent de trois sources, les probabilités de panne en même temps sont faibles.
phyrfox
3
@phyrfox - RAID-5 (et -6) a des caractéristiques de performances différentes de RAID-1 qui peuvent ne pas être compatibles avec son application. Avec des disques de grande taille (en particulier des disques de qualité grand public), si j'utilisais des niveaux RAID plus élevés, j'irais certainement avec RAID-6 pour me protéger contre une deuxième défaillance de disque tout en reconstruisant la baie après une seule défaillance de disque. J'exécute une matrice RAID-6 à 5 disques depuis 2 ans en utilisant un ensemble de disques achetés en même temps - un disque est tombé en panne par mois, tous les autres n'ont pas présenté de problème.
Johnny
1
@phyrfox RAID5 réduira le coût par mégaoctet, mais augmentera en fait les risques d'échec car il y a plus de disques à échouer.
Caltor

Réponses:

16

C'est une perte de temps.

Vous ne serez pas en mesure d'induire une panne ou de stresser les disques de manière significative. Vous avez RAID, et c'est un bon début. Assurez-vous simplement d'avoir une surveillance en place pour détecter les pannes au fur et à mesure qu'elles se produisent et des sauvegardes pour vous protéger contre les catastrophes.

ewwhite
la source
2
D'accord pour les HDS conventionnels, mais pour les ssds, c'est une histoire très différente. Je pensais que cela valait la peine d'être noté maintenant avant que les ssds de 4 To ne deviennent bon marché et disponibles et que les lecteurs ne réalisent pas que nous parlons de filature de rouille ici, mais peut-être qu'alors ils géreront plus d'écritures.
symcbean
3
Oui - il est certain que tout lecteur «d'entreprise» aura déjà été testé pour le faire passer au-delà des premières défaillances de la vie sur la courbe de la baignoire. Bien que je sache si vous achetez une paire de générateurs, le conseil est d'alterner de 66% à 33%, car de cette façon, ils ne s'usent pas simultanément. Avec les disques, le MTBF a un écart-type assez important, c'est donc beaucoup moins un problème.
Sobrique
5

Il peut être préférable d'utiliser simultanément différentes marques ou séries de disques si cela vous inquiète.

J'ai vu des disques de type similaire et l' âge ne en grappes, donc à mon humble avis , il est pas un leend urbain.

gémir
la source
1
Je l'ai aussi, mais cela a été dû au firmware douteux plutôt qu'à tout ce qui est lié au MTBF.
Sobrique
2

Grande question - Cependant, contrairement aux phares d'automobile, c'est une perte de temps. La valeur MTBF [temps moyen entre pannes] pour les disques de 4 Go [WD Red dans cet exemple] est de 1 000 000 heures. La probabilité que deux disques se détériorent dans un miroir en même temps est extrêmement rare. Quand j'ai vu cela se produire, c'est parce que le premier disque a échoué sans que personne ne s'en aperçoive. Plus utile pour protéger avec des sauvegardes que pour gêner la gravure d'un disque en premier. Si vous mélangez des types de lecteurs, assurez-vous que les lecteurs ont la même vitesse. Si vous êtes paranoïaque, RAID 10 est fait pour vous.

DocB
la source
MTBF suppose que les disques sont indépendants, qu'ils ne sont pas dans le même ensemble RAID. Il y a d'autres raisons pour lesquelles c'est une perte de temps, mais un nombre ridicule publié par le fabricant qui a une faible corrélation avec la réalité n'en fait pas partie.
HopelessN00b
5
Si un disque dur avait vraiment le temps moyen indiqué entre les pannes, alors pourquoi les périodes de garantie sont-elles si courtes? 1 million d'heures équivaut à 114 ans, à donner ou à prendre. Le WD Red Pro (parce que j'en ai choisi un sur le lot) semble venir avec une garantie de cinq ans. Même si vous mettez la moitié du temps moyen à l'échec, Western Digital ne croit toujours pas qu'il sera fiable pendant plus d' un dixième de la période MTBF indiquée. Maintenant, que seriez-vous plus enclin à croire? une statistique aléatoire sans obligation, ou où se trouve réellement l'argent? (Les retours de garantie, les remboursements, les rénovations et les remplacements coûtent de l'argent réel.)
un CVn
1
@ MichaelKjörling: S'ils garantissaient le MTBF, ils remplaceraient plus de 50% (oui, queue trop longue sur la distribution) des disques sous garantie. Bien sûr, vous devriez regarder où se trouve l'argent, mais je ne vois aucune raison de croire que le MTBF n'est pas un ordre de grandeur plus long que la garantie, et plusieurs le pensent.
Ben Voigt
@ MichaelKjörling J'ai vu du matériel avec un MTBF publié de 100k heures qui s'userait régulièrement après 1k heures de fonctionnement. La prochaine génération de matériel avait un MTBF publié de 200k heures. Lorsque le premier lot du nouveau matériel avait fonctionné pendant 48 heures, plus de 50% d'entre eux avaient échoué.
kasperd
1

Bien que cela soit logique en théorie, les données ne prennent pas en charge la nécessité de work invotre lecteur.
Non seulement quelques semaines n'auront pas vraiment d'impact, mais les pourcentages de pannes ne fonctionnent pas vraiment lorsque l'on regarde seulement deux disques.

Bien qu'il y ait eu des indications de taux de panne plus normalisés en ce qui concerne les disques du même modèle.

La plupart des résultats liés à l'âge sont influencés par les millésimes de conduite ... Fait intéressant, cela ne change pas nos conclusions. Contrairement aux résultats liés à l'âge, nous notons que tous les résultats présentés dans le reste de l'article ne sont pas affectés de manière significative par la composition de la population. (c'est moi qui souligne)

En tant que tel, les échecs liés à l'âge, qui ne sont qu'un petit sous-ensemble d'échecs, peuvent être quelque peu corrélés aux millésimes de conduite. Mais la majorité des échecs ne le peuvent pas.
Si vous ajoutez à cela les pourcentages de défaillance globaux, qui peuvent culminer à 8% pour une année donnée, les chances que les deux disques tombent en panne au cours de la même année sont faibles, les pannes au cours de la même semaine sont négligeables.
Et c'est si vous regardez toutes les causes possibles d'échec, pas seulement les échecs liés à l'âge.

Si vous voulez minimiser le risque, mais deux disques d'un millésime différent.
Si vous voulez des assurances, achetez une assurance.
Et comme la réponse d'ewwhite l'a déjà dit, les sauvegardes et la surveillance sont indispensables.

Reaces
la source
0

C'est généralement un argument pour les SSD plus que les disques durs dans mon expérience. Les SSD ont des cycles d'écriture limités, donc si vous utilisez un RAID1 avec deux SSD du même modèle, les deux devraient manquer de cycles d'écriture presque en même temps.

En ce qui concerne les défaillances générales, sauf si vous avez un problème grave comme les vibrations de masse, l'électricité statique ou la chaleur élevée; Je ne pense pas que vous verrez 2 disques sur 2 tomber en panne en même temps.

Une principale préoccupation avec RAID1 (et RAID10) avec des disques plus gros comme 4 To est la reconstruction. Avec un miroir à 2 disques, lorsqu'un disque tombe en panne, l'autre disque supporte alors le double de la charge de travail. Ensuite, lorsque vous reconstruisez, ce lecteur reçoit encore plus de charge. S'il y avait un problème avec ce lecteur, il est probable qu'il échoue dans ces conditions, en particulier si la reconstruction d'un miroir de 4 To sous charge peut prendre beaucoup de temps.

Devon
la source
0

Vous pouvez le faire, mais cela n'aidera pas trop.

Par exemple, s'il y a une aiguille dans la puissance d'entrée, la même aiguille tuera les deux disques.

Ce qui est important: vous devez avoir une bonne sauvegarde. Raid ne compense pas une bonne sauvegarde. En fait, si vous avez une bonne sauvegarde, peut-être qu'un raid miroir n'est sûrement pas nécessaire (si vous pouvez tolérer un effondrement du système une fois environ 2-3 ans).

peterh - Réintégrer Monica
la source
3
Le RAID est une question de disponibilité, pas de sauvegarde de données. Le but est de garder le système disponible en cas de panne d'un disque, et non de protéger les données sur le disque.
HopelessN00b
@ HopelessN00b C'est exactement ce que j'ai essayé d'expliquer dans la réponse, peut-être que je n'étais pas assez clair?
peterh
Votre phrase à la fin brouille les eaux.
HopelessN00b
@ HopelessN00b Raid protège également contre la perte de données causée par des pannes de disque. Cela conduit souvent à la fausse conclusion selon laquelle il peut être utilisé comme sauvegarde. Mais à l'aide de raid et à l'aide de sauvegardes, ce sont des choses dépendantes de la situation. Dans certains cas, même un environnement sysadm professionnel n'a pas besoin des deux. À mon avis, l'objectif n'est pas de forcer à la fois un administrateur système inexpérimenté, mais de lui faire comprendre que la mise en miroir des disques et la sauvegarde de ses données sont des solutions différentes pour différents problèmes.
peterh