Quand le RAID vaut-il la peine?

14

Dans notre boutique, nous utilisons fidèlement le RAID sur tous nos postes de travail, probablement juste parce que cela semble être la façon dont cela devrait être fait. Je parle de postes de travail pour des simulations scientifiques, en utilisant les puces RAID intégrées.

Mais j'ai entendu beaucoup d'histoires d'horreur RAID. Stackoverflow lui-même a eu une panne provoquée indirectement par le contrôleur RAID .

RAID vous protège contre un type de défaillance très étroit - défaillance de disque physique - mais en même temps, il introduit également des points de défaillance supplémentaires. Il peut y avoir des problèmes avec le contrôleur RAID, et il y en a souvent. Dans notre boutique au moins, il semble que les contrôleurs RAID tombent en panne au moins aussi souvent que les disques eux-mêmes. Vous pouvez également facilement gâcher quelque chose avec le processus d'échange d'un lecteur défectueux.

Quand le RAID vaut-il la peine? N'obtenez-vous pas un meilleur retour sur investissement en ajoutant plus de redondance à vos solutions de sauvegarde? Quel type de RAID est meilleur ou pire à cet égard?

Edit: j'ai changé le titre de l'original "Le RAID vaut-il la peine?", Donc ça sonne moins négatif

amarillion
la source
3
Lorsque vous dites utiliser RAID sur des postes de travail, je me demande ce que vous entendez par RAID. Le RAID fourni avec le chipset d'une carte mère de bureau n'est pas vraiment un RAID. Le vrai RAID est une option coûteuse (plusieurs centaines, voire des milliers de dollars), généralement implémentée en tant que carte PCI d'un certain type. Pensez Adaptec ou LSI, pas Promise.
Jason Tan
1
Vous avez raison, nous utilisons une solution de chipset intégrée. Alors peut-être que ma question devrait être modifiée un peu: le RAID bon marché en vaut-il la peine?
amarillion

Réponses:

17

Ne vous inquiétez pas, le RAID n'est pas utilisé dans le monde des affaires à cause de la pensée de groupe! Le risque de défaillance de contrôleurs RAID décents est de loin, bien inférieur au risque de défaillance d'un disque. Je ne me souviens pas avoir vu un contrôleur RAID tomber en panne dans la vraie vie, alors que j'ai vu plusieurs disques mourir, à la fois au bureau et dans le centre de données.

PS: je vois vos tags. RAID n'est pas une sauvegarde! :)

Alex J
la source
1
Bon, ce n'est pas une sauvegarde. Alors c'est de la redondance? Il s'agit donc vraiment de temps de disponibilité élevés? À moins que vous ayez besoin de cinq neuf, vous n'avez pas vraiment besoin de RAID?
amarillion
6
Non, c'est une question de disponibilité. Retirer la machine quand vous le souhaitez est bien. Avoir un seul disque dur décide de démonter votre machine ne l'est pas. L'utilisation correcte de RAID empêche cela de se produire.
Matt Simmons
9
@amarillion. Wow, c'est un sentiment dangereux. Quelle est votre expérience avec les disques durs? Le RAID est à peu près nécessaire pour même 2 neuf de fiabilité (d'autant plus que le plus de disques durs sont dans le mélange), et le RAID seul ne vous mènera certainement pas à 5 neuf, vous aurez besoin de centres de données redondants pour cela, au moins. Même alors, c'est un crapshoot, 5 neuf est la gestion fantasy land BS, c'est moins d'une heure de temps d'arrêt par décennie (~ 5 min / an). Même les dorsales IP n'ont pas cela.
Wedge
4
@amarillion: Certains de mes clients ont des développeurs sur place facturant 200 $ / h. Ou des travailleurs réagissant à des situations de vie ou de mort. Perturber ces travailleurs pour une coutume d'un disque dur de 80 $ me semble un peu stupide, YMMV.
duffbeer703
3
Non. RAID vous protège contre les pannes de disque dur. Il ne vous protège pas de 'rm -rf /'. C'EST POUR QUOI LES SAUVEGARDES SONT!
Alex J
9

ZFS by SUN (également inclus dans OpenSolaris; Apples OSX - actuellement en lecture seule) non seulement effectue un raid à différents niveaux, mais vérifie toujours si les données écrites sur le disque sont réellement là. la cohérence est la clé! Le RAID est inutile si vous ne pouvez pas compter sur son intégrité . Choisissez un contrôleur RAID décent (je préfère HP) et nettoyez votre RAID pour trouver périodiquement des erreurs.

D'autre part, Softwareraid (comme ZFS) vous rend plus indépendant du matériel si le contrôleur RAID meurt et vous ne pouvez pas obtenir un remplacement exact.

lepole
la source
8

Toujours. Les disques sont bon marché, vos informations ne le sont pas. Mais utilisez le RAID logiciel, vous avez donc la possibilité d'avancer ou de changer de matériel plus tard (croyez-moi, vous en aurez besoin). Et utilisez également un système de fichiers à somme de contrôle comme ZFS, pour vous protéger contre la corruption silencieuse des données (ce qui est très probable avec les gros disques de nos jours).

Rudd-O
la source
8

Pour ceux d'entre vous qui disent que vous n'utiliserez pas de RAID matériel parce que si le contrôleur tombe en panne et que vous ne pouvez pas obtenir un remplacement identique votre vissé, vous vous y prendrez dans le mauvais sens.

  1. Si le temps de disponibilité est si important pour vous, vous ne devriez PAS acheter du matériel bon marché. Comme cela a été dit précédemment, utilisez un bon contrôleur de raid, HP, LSI, Dell, etc.

  2. Si le contrôleur a été acheté auprès du fabricant de l'ordinateur, c'est-à-dire un serveur Dell, avec un contrôleur RAID Dell, Dell vous dira pendant combien de temps ils stockeront ces pièces, généralement au cours des 4+ années à partir de la fin de vie de ce serveur.

  3. Si le fait de renvoyer quelqu'un rapidement signifie que vous ne pouvez pas attendre la livraison, vous devriez acheter un deuxième contrôleur de rechange pour vous, peu importe qui l'a fait.

  4. Si vous configurez en tant que RAID 1, vous pouvez parfois prendre celui-ci et le déposer sur un contrôleur normal pour récupérer les données. Si cela est important pour vous, confirmez / testez cela avec votre contrôleur avant de vous trouver dans une situation critique.

Le RAID matériel a sauvé mes fesses 2x. Une fois sur un serveur de messagerie, l'un des disques est tombé en panne, j'ai reçu l'alerte par e-mail du logiciel de surveillance du raid sur cette machine, j'ai appelé Dell et j'ai eu un nouveau disque le lendemain, je l'ai fait entrer et il a reconstruit tout seul. ZERO temps d'arrêt sur celui-là

Deuxièmement, un disque a échoué dans un ancien serveur de fichiers dont le remplacement était prévu dans 6 mois. Le contrôleur a continué à fonctionner et nous avons déplacé le remplacement du serveur jusqu'à cette semaine. Économisé en achetant un nouveau disque (car il était hors de garantie) et encore une fois le temps d'arrêt ZERO.

J'ai déjà utilisé des raids logiciels et ils ne récupèrent tout simplement pas aussi bien que ceux basés sur le matériel. Vous devez tester votre configuration, votre logiciel ou votre matériel pour vous assurer que cela fonctionne et savoir quoi faire lorsque la substance brune frappe le ventilateur.

LEAT
la source
3
Les gens ont tendance à considérer le RAID comme un type d'assurance. S'ils n'obtiennent pas un «accident», alors les avantages du RAID (assurance) ne semblent jamais apparents. Merci d'avoir partagé votre histoire car de nombreuses personnes (je pense) prennent le RAID à la légère car si elles n'ont jamais une mauvaise expérience, pourquoi investir dans quelque chose qui pourrait ne pas arriver? Cela devrait être une leçon pour tous ceux qui lisent: un contrôleur RAID matériel solide sauvera votre cul dans celui sur un million / milliard de chances. Ne le laissez pas au hasard; utilisez toujours un bon contrôleur RAID matériel, en particulier pour les serveurs.
osij2is le
6

Les pannes de disque dur sont beaucoup plus susceptibles de se produire sur un serveur que sur un poste de travail de bureau ...

Vous ne pouvez pas simplement dire "ajouter plus de points d'échec" sans tenir compte de la probabilité de cet échec. D'autant plus que ces points de défaillance moins probables sont spécifiquement en place pour renverser le plantage le plus probable du disque dur. Comme vous l'avez dit, vous avez essentiellement créé une erreur de type pari de Pascal .

La plupart des systèmes RAID sur les cartes mères de bureau sont des hybrides logiciels / matériels cheapo avec la plupart du travail effectué dans son pilote logiciel. À mon humble avis, ce sont des morceaux de merde utilisés pour vendre aux utilisateurs expérimentés.

D'un autre côté, un bon RAID matériel réel est assez fiable et il a le matériel pour faire son travail sans (malgré?) Le système d'exploitation. Mais ceux-ci deviennent chers, car le vrai matériel a généralement des sauvegardes de batterie et un tableau XOR complet pour calculer les sommes de contrôle, etc. Encore plus cher si cela se fait à l'aide de SCSI.

Résumé: Si vous utilisez les systèmes RAID basés sur la carte mère, alors non, cela ne vaut pas la peine.

Ape-inago
la source
3
Un collègue gère un environnement informatique de grande école avec 180 000 postes de travail avec un service d'assistance de premier ordre. 7% de leurs ordinateurs de bureau nécessitent un remplacement de matériel au cours de leur cycle de vie de 5 ans, et 85% de ces remplacements sont des disques durs.
duffbeer703
Oui, mais si un poste de travail tombe en panne, il suffit que l'utilisateur se connecte à une autre machine pendant que vous réparez celle qui est cassée. Avec autant de postes de travail, leur pouvoir d'être un référentiel de fichiers central. Je me demande à quoi ressemblerait la statistique avec 180 000 serveurs.
Ape-inago
1
Vous avez raison dans de nombreuses circonstances, mais pas pour tout le monde. Dans le scénario de mon ami, beaucoup de ces PC sont à l'arrière des salles de classe, et s'ils sont cassés, cette classe n'a pas d'ordinateur et c'est un gros problème. À mon travail, nous avons des postes de travail de rechange et ne nous soucions pas vraiment.
duffbeer703
5

Bien que les sauvegardes et le RAID soient des solutions à différents problèmes, la plupart des «problèmes RAID» sont très similaires au problème de sauvegarde le plus courant (c.-à-d. Personne ne teste une restauration) - personne ne teste la récupération du système. D'autres problèmes RAID sont souvent le résultat direct du fait que les gens ne comprennent pas ce qu'il fait et ce qu'il ne fait pas. Par exemple, de nombreuses personnes pensent que le RAID garantit l'intégrité de leurs données - ce n'est pas le cas.

Pour les postes de travail, si vous utilisez RAID-0 pour améliorer les performances des applications liées aux E / S, ou RAID-1/5/6 pour que le scientifique de 100 $ / heure travaille lorsque son disque dur de 80 $ tombe en panne, vous utilisez le RAID de manière appropriée. Ne confondez pas la redondance de disque avec la sauvegarde et testez des procédures pour vous assurer que vos informaticiens gèrent la récupération.

duffbeer703
la source
Bonne note pour les postes de travail. Les besoins des postes de travail sont complètement différents des besoins des serveurs. Et un oui catégorique sur ".. ne confondez pas la redondance du disque avec la sauvegarde".
osij2is
4

Il existe deux types de RAID

  • Celui qui est intégré à bas prix. Ce n'est PAS un vrai raid le vrai travail est fait par le logiciel (le pilote spécial fait les calculs du raid). Vous devez éviter celui-ci.
  • L'autre est cher, mais ce que vous obtenez est un vrai raid. Si vous pouvez vous le permettre, cela en vaut la peine.

Certains systèmes d'exploitation ont une bonne solution de raid logiciel (cela n'a rien à voir avec les cartes merdiques mentionnées ci-dessus). Le raid logiciel Linux est particulièrement bon, ses performances sont vraiment bonnes.

Raid ne peut qu'améliorer la fiabilité, ce n'est pas une solution de sauvegarde. Les fichiers peuvent être supprimés accidentellement, un disque défectueux peut retourner (et dupliquer) de mauvaises données vers d'autres disques dans une matrice de raid, donc une vraie solution de sauvegarde est toujours nécessaire.

cstamas
la source
4

Le RAID est idéal pour la disponibilité, mais il ne remplace pas la sauvegarde. Comme l'a déjà dit un collègue: «Vous savez que« Oh, sh! T », moment où vous avez supprimé quelque chose accidentellement? RAID signifie simplement que vous obtenez« Oh, sh! T »plus d'un lecteur en même temps.

Cela dit, ce jour-là, lorsque vous passez la tête dans le bureau de votre patron et que vous lui dites: "Au fait, le serveur de base de données a eu un crash de disque dur la nuit dernière - nous ne sommes jamais tombés en panne, il a fini de reconstruire sur le disque de rechange à 5 heures du matin et J'ai envoyé le mauvais disque sous garantie "- c'est là que le RAID n'a pas de prix.

user6622
la source
2

Quel est votre taux d'échec sur les disques durs et les contrôleurs RAID? La défaillance du contrôleur RAID doit être bien inférieure à celle des disques. Si vous avez un taux d'échec élevé, vous voudrez peut-être examiner votre environnement, comme les décharges statiques qui pourraient causer des problèmes.

Pour les postes de travail, vous souhaiterez peut-être utiliser le raid logiciel comme suggéré par Alakdae, car vous n'aurez pas à vous soucier de maintenir les stocks du contrôleur matériel précis. Cependant, vous devriez avoir toutes les informations vitales stockées sur vos serveurs qui ont un raid matériel et sont sauvegardés sur différents supports.

Les fabricants de matériel serveur maintiennent des contrôleurs RAID, donc même s'il s'agit d'un contrôleur plus ancien, vous pouvez généralement l'obtenir auprès d'eux si vous en avez besoin (cela vous coûtera cependant un bon centime).

David Yu
la source
2

Il semble que beaucoup des articles ci-dessus oublient la question d'origine et ne font que débattre sur le RAID 1. La question était "Quand le RAID vaut-il la peine?" Eh bien, cela dépend ... Si vos développeurs font beaucoup de données en lecture et en écriture avec leurs postes de travail, une configuration RAID 0 en vaudrait la peine. Ajouter plus de disques à ce RAID 0 va bien sûr augmenter la vitesse et les performances MAIS augmentera la probabilité d'une panne (disque ou contrôleur).

Je travaille pour une école d'infirmières avec environ 500 machines Dell déployées et presque aucune n'utilise de RAID. Il me semble que mon type d'utilisateurs ne verra pas suffisamment d'avantages pour ajouter la complexité d'un système RAID sur chaque machine. Je m'inquiète plus de la récupération de données et de l'imagerie disque que de la vitesse du RAID 0 ou de la redondance du RAID 1. Bien sûr, je ne parle pas de nos serveurs de production, c'est une autre histoire. La récupération des données étant cruciale, nous comptons sur d'autres méthodes de sauvegarde pour prendre en compte plus que la simple redondance des disques. Tout type de RAID ne vous aidera pas si un utilisateur supprime accidentellement un fichier.

Donc, pour répondre à votre question à mon humble avis ... RAID 0 sur un poste de travail en vaut la peine lorsque l'utilisateur a besoin de la performance. (Assurez-vous simplement que toutes les données importées sont sauvegardées.) Je suis sûr que vous pouvez vérifier le débit de données sur la configuration existante pour voir si elle est adéquate. RAID 1 doit être utilisé dans l'environnement de serveur où des contrôleurs RAID de classe supérieure sont disponibles. Cela ne vaut pas la peine sur un poste de travail car cela complique le déploiement, la création d'image disque et les réparations. Beaucoup de ces postes de travail sont livrés avec des contrôleurs RAID intégrés à la carte mère.

Treybus
la source
2

Le RAID logiciel Linux est excellent, et il bat en fait le RAID matériel bas de gamme. Il a également quelques optimisations qui peuvent être utiles pour un poste de travail. Par exemple, il peut lire différentes choses sur chaque disque en même temps, doublant efficacement les temps de lecture à accès aléatoire, ce qui est un cas d'utilisation courant contrairement aux opérations liées au taux de transfert optimisées par RAID 0 .

Quant à la fiabilité, c'est une partie très bien entretenue du noyau Linux, utilisée par des millions de personnes, elle gère très bien les pannes matérielles, c'est donc clairement une victoire en ce qui concerne la disponibilité. Je l'ai utilisé sur mes postes de travail personnels ainsi que sur quelques dizaines de serveurs bas de gamme pendant des années, certains assez chargés, et je n'ai jamais pu lui attribuer de défaut. J'ai cependant connu une bonne dizaine de disques cassés entre-temps.

(Les cartes RAID matérielles haut de gamme ont cependant d'autres fonctionnalités, telles que le cache d'écriture sur batterie. Elle multiplie essentiellement par dix la vitesse d'écriture du disque synchronisé aléatoire. Elle est absolument nécessaire pour les bases de données, probablement assez inutile pour les postes de travail.)

niXar
la source
J'espère que cela double l'accès aléatoire en lecture / vitesse /, pas en lecture / heure / :)
Bill Weiss
1

Je viens de faire échouer les contrôleurs RAID de deux serveurs (identiques), puisque nous avons obtenu ces deux machines, nous n'avons eu aucune défaillance de disque dur dans toute l'entreprise.

Je pense que le RAID sur le bureau est une mauvaise idée, les contrôleurs RAID bon marché que vous allez mettre sur ces machines échoueront bien avant le disque dur réel.

Sur les serveurs, peut-être que je ne ferai plus confiance aux contrôleurs RAID, assurez-vous d'avoir une machine de rechange et de bonnes sauvegardes.

Nir
la source
1

Je suis développeur et tous nos postes de travail utilisent le RAID pour les disques internes. RAID 0. Cela en vaut vraiment la peine. Vous ne voudrez plus jamais revenir à la compilation à partir d'un seul disque à 7200 tr / min après avoir essayé une paire de 15000.
J'ai été mis au défi si c'est le RAID ou le lecteur 15k qui raccourcit les temps de compilation. Je ne sais pas, car compiler un seul disque rapide peut donner exactement les mêmes performances. Cependant, un seul disque SAS n'est pas particulièrement grand pour un PC moderne, donc le RAID embarqué peu coûteux a toujours sa place. Cela et je doute que RAID va jamais nuire aux performances du système.
Je pense que ce type de RAID est certainement approprié pour une station de travail et est probablement mieux fait en utilisant les contrôleurs embarqués peu coûteux. Du côté du serveur, la plupart de nos serveurs ont une certaine forme de matrice RAID pour le disque du système d'exploitation et les données sont alors sur une matrice distincte d'une forme appropriée. Je ne connais pas nos serveurs de production mais nos serveurs de développement (dont nous avons une bonne quantité) n'ont jamais eu de panne de contrôleur, nous avons eu des pannes de disques cependant. Dans un cas, la moitié de la baie de système d'exploitation a échoué sur une boîte SQL, alors qu'elle était en cours de reconstruction, l'autre disque a échoué! Parfois, RAID1 ne suffit pas!

pipTheGeek
la source
1
Je dois appeler BS sur celui-ci. RAID 0 est inutile pour un poste de travail développeur. RAID 0 au meilleur double les taux de transfert; il ne fait rien pour un accès aléatoire. Devinez ce que font les développeurs ... lisez et écrivez de nombreux petits fichiers, et parfois de gros fichiers. Le seul poste de travail qu'il serait utile serait celui d'un graphiste faisant du montage vidéo, où vous avez besoin de tous les Go / s que vous pouvez obtenir.
niXar
Cela peut être vrai, je n'ai pas comparé les performances d'un seul disque sas 15k à celles du raid 0 sur deux disques. J'ai mis à jour ma réponse.
pipTheGeek
1
Cela dépend de ce que font vos développeurs. Nous avons des gars qui travaillent avec des ensembles de données volumineux qui remarquent une amélioration significative des performances, en particulier lors des compilations. Les gars du SIG remarquent également une amélioration avec RAID 0.
duffbeer703
Passer d'un disque 7.2k à un disque 15k signifierait une accélération substantielle. Il n'y a pas grand-chose à gagner du Raid 0.
Loren Pechtel
Un SSD unique serait sûrement moins cher et plus rapide de nos jours?
Dentrasi
1

Pour vos postes de travail scientifiques, cela peut valoir la peine SI ces systèmes fonctionnent mieux avec leurs données stockées localement, par opposition à un partage sur un serveur de fichiers. Pour la population en général, je dirais que non. Cela ne vaut pas la peine et les maux de tête quand tout ce dont vous avez vraiment besoin est de restaurer les données qui doivent être conservées sur les partages.

Shawn Anderson
la source
1

Le RAID n'est utile que lorsque vous ne pouvez absolument pas faire arrêter le serveur de manière inattendue. Nous utilisons RAID sur tous nos serveurs dans notre centre de données où il n'y a pas d'autre forme de redondance. Par exemple, nous n'utilisons pas de RAID sur nos serveurs Web, car 10 autres fonctionnent toujours.

Le test décisif est "si un disque se casse au milieu de la nuit et qu'il ne peut pas attendre jusqu'à 9h, il a besoin de RAID"

David Pashley
la source
Il existe d'autres contextes où cela a du sens - comme si vous ne disposez pas d'un moyen rapide et facile de restaurer la machine à son état antérieur.
cp.engr
1

Le RAID en vaut la peine lorsque vous avez un contrôleur alimenté par batterie.

Pour les applications serveur qui fdatasync () utilisent fréquemment des fichiers journaux (ce qui n'est pas rare dans les bases de données) pour plus de durabilité, vous finirez par écrire les mêmes blocs encore et encore. Cela tuera les performances d'E / S si vous n'avez pas de contrôleur alimenté par batterie.

Si vous avez un contrôleur avec batterie, la plupart des écritures n'atteindront même pas les disques, mais resteront simplement en mémoire jusqu'à ce qu'elles soient remplacées par une autre écriture. C'est une bonne chose.

La redondance est un bonus mais pas indispensable, car les choses importantes doivent être redondantes au niveau du système.

MarkR
la source
1

Les implémentations RAID bon marché sont terribles.

Vos choix sont, par ordre de fiabilité:

1) Serveurs HP DL avec leur RAID matériel.
2) Cartes RAID 3Ware.
3) ZFS
4) Raid logiciel Linux

Tout autre élément pose problème, et peut en effet entraîner une fiabilité globale inférieure à une solution non RAID.

Demandez-vous quoi faire si votre contrôleur tombe en panne et que le fabricant est en faillite.

Déterminez si vous pouvez récupérer après une panne apparente de double disque causée par des problèmes d'alimentation / de câblage.

Ce sont deux exemples parmi des centaines.

carlito
la source
1

Pour les postes de travail, le RAID n'en vaut probablement pas la peine par rapport à un nouveau système sur lequel les données peuvent être restaurées ...

Beaucoup parlaient de RAID 0 ... ce n'est pas là pour aider à la disponibilité. Vous doublez les chances d'échec du volume, car une fois qu'un lecteur meurt, vous perdez le tout. RAID 0 consiste à jouer avec la vitesse d'accès aux lectures / écritures sur un volume et à offrir plus de stockage. La seule façon dont cela pourrait aider dans un environnement professionnel est de prendre deux RAID 0 et de les mettre en miroir en tant que RAID 1.

RAID n'est pas une solution de sauvegarde, comme cela a été souligné.

Le RAID n'est pas non plus parfait. Je pense que cet article du blog de ce type résume ce que je pense du RAID et quand ça vaut le coup: Vous pensez au RAID?

Sur un poste de travail, vous devriez être en mesure d'amener une personne à utiliser un autre système pendant le déploiement d'un remplacement. Pourquoi utiliser RAID? Ses données doivent être stockées sur le serveur où la gestion, l'intégrité des données et les sauvegardes sont centralisées. La station de travail doit être configurée de manière à pouvoir être périodiquement mise à niveau ou modifiée selon les finances et le RAID n'est qu'une autre couche de coûts et de maux de tête à gérer (plus les problèmes d'utilisation d'énergie et de chauffage avec des lecteurs supplémentaires et l'imposition du flux d'air). Dans la majorité des cas pour les entreprises, il est probablement beaucoup plus rentable de placer l'argent d'une carte RAID dans un disque plus grand, et si vous utilisez un RAID intégré, vous aurez toujours des problèmes car il a tendance à lier le RAID format à la carte mère (et ce n'est pas vrai RAID de toute façon ... on le trouve dans les recherches Google comme "faux raid".

Bart Silverstrim
la source
0

Pourquoi s'embêter sur un poste de travail? Vous avez sûrement tous vos répertoires personnels et données stockés de manière centralisée. C'est là que vous souhaitez utiliser le raid.

goo
la source
0

Si vous vous inquiétez de la défaillance d'un contrôleur de lecteur, vous devez également tenir compte de la défaillance du serveur - ventilateurs, carte mère, RAM, réseau ... et vous devez également tenir compte de la défaillance du routeur, du câblage et de l'alimentation ... et vous devez également tenir compte de la défaillance du centre de données (inondation, incendie, erreur humaine), puis de la défaillance du réseau externe (câbles coupés - tout le temps à certains endroits!).

En bref, vous pouvez vous soucier des temps d'arrêt du site au point de ne jamais vous soucier de mettre quoi que ce soit en ligne! Ou vous pouvez comparer le risque d'échec au coût de la redondance et obtenir une approche beaucoup plus réaliste. Et de toutes les choses que j'ai énumérées, le disque dur est le point de défaillance le plus probable.

À côté de l'erreur humaine, c'est. Qui tape " shutdown -h now" quand ils ont voulu redémarrer .... :(

gbjbaanb
la source
0

Ma grande inquiétude est les disques, car il semble que vous ne puissiez pas acheter les bon marché:

Un fournisseur majeur note:

«La plupart des contrôleurs RAID sont conçus pour expirer une commande donnée si le lecteur de disque ne répond plus dans un délai donné. Le résultat sera que le lecteur apparaîtra hors ligne ou sera marqué comme mauvais et une alerte sera donnée au client. Les disques de classe entreprise (ou disques conçus pour les environnements RAID) ont une limite de nouvelle tentative avant qu'un secteur ne soit marqué comme mauvais. Cette limite de nouvelle tentative permet au lecteur de répondre au contrôleur RAID dans le délai prévu. Alors que les disques de bureau peuvent fonctionner avec un contrôleur RAID, la baie se déconnecte progressivement à mesure que le disque vieillit et peut entraîner une perte de données.

Cela me semble insensé, un autre problème qui garantit que les vendeurs de disques recevront beaucoup de retours de personnes qui ne savent pas mieux. Cependant, j'ai lu que Google a fait un livre blanc (je ne le trouve pas) qui montre qu'il n'y a pas de différence de fiabilité de lecteur entre les deux `` classes '' proposées par les fournisseurs de stockage. Je doute que Google utilise des contrôleurs RAID matériels dans leur flotte de boîtes beiges.

Peut-être que mdadm (dans linux raid) a des paramètres que l'on peut utiliser pour gérer les paramètres les plus impatients des firmwares de disques de bureau?

Peut-être qu'en réalité, tout le monde paie sa garantie à travers une période de «délai d'attente» dans le firmware du contrôleur?

Pluton
la source