Dans notre boutique, nous utilisons fidèlement le RAID sur tous nos postes de travail, probablement juste parce que cela semble être la façon dont cela devrait être fait. Je parle de postes de travail pour des simulations scientifiques, en utilisant les puces RAID intégrées.
Mais j'ai entendu beaucoup d'histoires d'horreur RAID. Stackoverflow lui-même a eu une panne provoquée indirectement par le contrôleur RAID .
RAID vous protège contre un type de défaillance très étroit - défaillance de disque physique - mais en même temps, il introduit également des points de défaillance supplémentaires. Il peut y avoir des problèmes avec le contrôleur RAID, et il y en a souvent. Dans notre boutique au moins, il semble que les contrôleurs RAID tombent en panne au moins aussi souvent que les disques eux-mêmes. Vous pouvez également facilement gâcher quelque chose avec le processus d'échange d'un lecteur défectueux.
Quand le RAID vaut-il la peine? N'obtenez-vous pas un meilleur retour sur investissement en ajoutant plus de redondance à vos solutions de sauvegarde? Quel type de RAID est meilleur ou pire à cet égard?
Edit: j'ai changé le titre de l'original "Le RAID vaut-il la peine?", Donc ça sonne moins négatif
la source
Réponses:
Ne vous inquiétez pas, le RAID n'est pas utilisé dans le monde des affaires à cause de la pensée de groupe! Le risque de défaillance de contrôleurs RAID décents est de loin, bien inférieur au risque de défaillance d'un disque. Je ne me souviens pas avoir vu un contrôleur RAID tomber en panne dans la vraie vie, alors que j'ai vu plusieurs disques mourir, à la fois au bureau et dans le centre de données.
PS: je vois vos tags. RAID n'est pas une sauvegarde! :)
la source
ZFS by SUN (également inclus dans OpenSolaris; Apples OSX - actuellement en lecture seule) non seulement effectue un raid à différents niveaux, mais vérifie toujours si les données écrites sur le disque sont réellement là. la cohérence est la clé! Le RAID est inutile si vous ne pouvez pas compter sur son intégrité . Choisissez un contrôleur RAID décent (je préfère HP) et nettoyez votre RAID pour trouver périodiquement des erreurs.
D'autre part, Softwareraid (comme ZFS) vous rend plus indépendant du matériel si le contrôleur RAID meurt et vous ne pouvez pas obtenir un remplacement exact.
la source
Toujours. Les disques sont bon marché, vos informations ne le sont pas. Mais utilisez le RAID logiciel, vous avez donc la possibilité d'avancer ou de changer de matériel plus tard (croyez-moi, vous en aurez besoin). Et utilisez également un système de fichiers à somme de contrôle comme ZFS, pour vous protéger contre la corruption silencieuse des données (ce qui est très probable avec les gros disques de nos jours).
la source
Pour ceux d'entre vous qui disent que vous n'utiliserez pas de RAID matériel parce que si le contrôleur tombe en panne et que vous ne pouvez pas obtenir un remplacement identique votre vissé, vous vous y prendrez dans le mauvais sens.
Si le temps de disponibilité est si important pour vous, vous ne devriez PAS acheter du matériel bon marché. Comme cela a été dit précédemment, utilisez un bon contrôleur de raid, HP, LSI, Dell, etc.
Si le contrôleur a été acheté auprès du fabricant de l'ordinateur, c'est-à-dire un serveur Dell, avec un contrôleur RAID Dell, Dell vous dira pendant combien de temps ils stockeront ces pièces, généralement au cours des 4+ années à partir de la fin de vie de ce serveur.
Si le fait de renvoyer quelqu'un rapidement signifie que vous ne pouvez pas attendre la livraison, vous devriez acheter un deuxième contrôleur de rechange pour vous, peu importe qui l'a fait.
Si vous configurez en tant que RAID 1, vous pouvez parfois prendre celui-ci et le déposer sur un contrôleur normal pour récupérer les données. Si cela est important pour vous, confirmez / testez cela avec votre contrôleur avant de vous trouver dans une situation critique.
Le RAID matériel a sauvé mes fesses 2x. Une fois sur un serveur de messagerie, l'un des disques est tombé en panne, j'ai reçu l'alerte par e-mail du logiciel de surveillance du raid sur cette machine, j'ai appelé Dell et j'ai eu un nouveau disque le lendemain, je l'ai fait entrer et il a reconstruit tout seul. ZERO temps d'arrêt sur celui-là
Deuxièmement, un disque a échoué dans un ancien serveur de fichiers dont le remplacement était prévu dans 6 mois. Le contrôleur a continué à fonctionner et nous avons déplacé le remplacement du serveur jusqu'à cette semaine. Économisé en achetant un nouveau disque (car il était hors de garantie) et encore une fois le temps d'arrêt ZERO.
J'ai déjà utilisé des raids logiciels et ils ne récupèrent tout simplement pas aussi bien que ceux basés sur le matériel. Vous devez tester votre configuration, votre logiciel ou votre matériel pour vous assurer que cela fonctionne et savoir quoi faire lorsque la substance brune frappe le ventilateur.
la source
Les pannes de disque dur sont beaucoup plus susceptibles de se produire sur un serveur que sur un poste de travail de bureau ...
Vous ne pouvez pas simplement dire "ajouter plus de points d'échec" sans tenir compte de la probabilité de cet échec. D'autant plus que ces points de défaillance moins probables sont spécifiquement en place pour renverser le plantage le plus probable du disque dur. Comme vous l'avez dit, vous avez essentiellement créé une erreur de type pari de Pascal .
La plupart des systèmes RAID sur les cartes mères de bureau sont des hybrides logiciels / matériels cheapo avec la plupart du travail effectué dans son pilote logiciel. À mon humble avis, ce sont des morceaux de merde utilisés pour vendre aux utilisateurs expérimentés.
D'un autre côté, un bon RAID matériel réel est assez fiable et il a le matériel pour faire son travail sans (malgré?) Le système d'exploitation. Mais ceux-ci deviennent chers, car le vrai matériel a généralement des sauvegardes de batterie et un tableau XOR complet pour calculer les sommes de contrôle, etc. Encore plus cher si cela se fait à l'aide de SCSI.
Résumé: Si vous utilisez les systèmes RAID basés sur la carte mère, alors non, cela ne vaut pas la peine.
la source
Bien que les sauvegardes et le RAID soient des solutions à différents problèmes, la plupart des «problèmes RAID» sont très similaires au problème de sauvegarde le plus courant (c.-à-d. Personne ne teste une restauration) - personne ne teste la récupération du système. D'autres problèmes RAID sont souvent le résultat direct du fait que les gens ne comprennent pas ce qu'il fait et ce qu'il ne fait pas. Par exemple, de nombreuses personnes pensent que le RAID garantit l'intégrité de leurs données - ce n'est pas le cas.
Pour les postes de travail, si vous utilisez RAID-0 pour améliorer les performances des applications liées aux E / S, ou RAID-1/5/6 pour que le scientifique de 100 $ / heure travaille lorsque son disque dur de 80 $ tombe en panne, vous utilisez le RAID de manière appropriée. Ne confondez pas la redondance de disque avec la sauvegarde et testez des procédures pour vous assurer que vos informaticiens gèrent la récupération.
la source
Il existe deux types de RAID
Certains systèmes d'exploitation ont une bonne solution de raid logiciel (cela n'a rien à voir avec les cartes merdiques mentionnées ci-dessus). Le raid logiciel Linux est particulièrement bon, ses performances sont vraiment bonnes.
Raid ne peut qu'améliorer la fiabilité, ce n'est pas une solution de sauvegarde. Les fichiers peuvent être supprimés accidentellement, un disque défectueux peut retourner (et dupliquer) de mauvaises données vers d'autres disques dans une matrice de raid, donc une vraie solution de sauvegarde est toujours nécessaire.
la source
Le RAID est idéal pour la disponibilité, mais il ne remplace pas la sauvegarde. Comme l'a déjà dit un collègue: «Vous savez que« Oh, sh! T », moment où vous avez supprimé quelque chose accidentellement? RAID signifie simplement que vous obtenez« Oh, sh! T »plus d'un lecteur en même temps.
Cela dit, ce jour-là, lorsque vous passez la tête dans le bureau de votre patron et que vous lui dites: "Au fait, le serveur de base de données a eu un crash de disque dur la nuit dernière - nous ne sommes jamais tombés en panne, il a fini de reconstruire sur le disque de rechange à 5 heures du matin et J'ai envoyé le mauvais disque sous garantie "- c'est là que le RAID n'a pas de prix.
la source
Quel est votre taux d'échec sur les disques durs et les contrôleurs RAID? La défaillance du contrôleur RAID doit être bien inférieure à celle des disques. Si vous avez un taux d'échec élevé, vous voudrez peut-être examiner votre environnement, comme les décharges statiques qui pourraient causer des problèmes.
Pour les postes de travail, vous souhaiterez peut-être utiliser le raid logiciel comme suggéré par Alakdae, car vous n'aurez pas à vous soucier de maintenir les stocks du contrôleur matériel précis. Cependant, vous devriez avoir toutes les informations vitales stockées sur vos serveurs qui ont un raid matériel et sont sauvegardés sur différents supports.
Les fabricants de matériel serveur maintiennent des contrôleurs RAID, donc même s'il s'agit d'un contrôleur plus ancien, vous pouvez généralement l'obtenir auprès d'eux si vous en avez besoin (cela vous coûtera cependant un bon centime).
la source
Il semble que beaucoup des articles ci-dessus oublient la question d'origine et ne font que débattre sur le RAID 1. La question était "Quand le RAID vaut-il la peine?" Eh bien, cela dépend ... Si vos développeurs font beaucoup de données en lecture et en écriture avec leurs postes de travail, une configuration RAID 0 en vaudrait la peine. Ajouter plus de disques à ce RAID 0 va bien sûr augmenter la vitesse et les performances MAIS augmentera la probabilité d'une panne (disque ou contrôleur).
Je travaille pour une école d'infirmières avec environ 500 machines Dell déployées et presque aucune n'utilise de RAID. Il me semble que mon type d'utilisateurs ne verra pas suffisamment d'avantages pour ajouter la complexité d'un système RAID sur chaque machine. Je m'inquiète plus de la récupération de données et de l'imagerie disque que de la vitesse du RAID 0 ou de la redondance du RAID 1. Bien sûr, je ne parle pas de nos serveurs de production, c'est une autre histoire. La récupération des données étant cruciale, nous comptons sur d'autres méthodes de sauvegarde pour prendre en compte plus que la simple redondance des disques. Tout type de RAID ne vous aidera pas si un utilisateur supprime accidentellement un fichier.
Donc, pour répondre à votre question à mon humble avis ... RAID 0 sur un poste de travail en vaut la peine lorsque l'utilisateur a besoin de la performance. (Assurez-vous simplement que toutes les données importées sont sauvegardées.) Je suis sûr que vous pouvez vérifier le débit de données sur la configuration existante pour voir si elle est adéquate. RAID 1 doit être utilisé dans l'environnement de serveur où des contrôleurs RAID de classe supérieure sont disponibles. Cela ne vaut pas la peine sur un poste de travail car cela complique le déploiement, la création d'image disque et les réparations. Beaucoup de ces postes de travail sont livrés avec des contrôleurs RAID intégrés à la carte mère.
la source
Le RAID logiciel Linux est excellent, et il bat en fait le RAID matériel bas de gamme. Il a également quelques optimisations qui peuvent être utiles pour un poste de travail. Par exemple, il peut lire différentes choses sur chaque disque en même temps, doublant efficacement les temps de lecture à accès aléatoire, ce qui est un cas d'utilisation courant contrairement aux opérations liées au taux de transfert optimisées par RAID 0 .
Quant à la fiabilité, c'est une partie très bien entretenue du noyau Linux, utilisée par des millions de personnes, elle gère très bien les pannes matérielles, c'est donc clairement une victoire en ce qui concerne la disponibilité. Je l'ai utilisé sur mes postes de travail personnels ainsi que sur quelques dizaines de serveurs bas de gamme pendant des années, certains assez chargés, et je n'ai jamais pu lui attribuer de défaut. J'ai cependant connu une bonne dizaine de disques cassés entre-temps.
(Les cartes RAID matérielles haut de gamme ont cependant d'autres fonctionnalités, telles que le cache d'écriture sur batterie. Elle multiplie essentiellement par dix la vitesse d'écriture du disque synchronisé aléatoire. Elle est absolument nécessaire pour les bases de données, probablement assez inutile pour les postes de travail.)
la source
Je viens de faire échouer les contrôleurs RAID de deux serveurs (identiques), puisque nous avons obtenu ces deux machines, nous n'avons eu aucune défaillance de disque dur dans toute l'entreprise.
Je pense que le RAID sur le bureau est une mauvaise idée, les contrôleurs RAID bon marché que vous allez mettre sur ces machines échoueront bien avant le disque dur réel.
Sur les serveurs, peut-être que je ne ferai plus confiance aux contrôleurs RAID, assurez-vous d'avoir une machine de rechange et de bonnes sauvegardes.
la source
Je suis développeur et tous nos postes de travail utilisent le RAID pour les disques internes. RAID 0. Cela en vaut vraiment la peine. Vous ne voudrez plus jamais revenir à la compilation à partir d'un seul disque à 7200 tr / min après avoir essayé une paire de 15000.
J'ai été mis au défi si c'est le RAID ou le lecteur 15k qui raccourcit les temps de compilation. Je ne sais pas, car compiler un seul disque rapide peut donner exactement les mêmes performances. Cependant, un seul disque SAS n'est pas particulièrement grand pour un PC moderne, donc le RAID embarqué peu coûteux a toujours sa place. Cela et je doute que RAID va jamais nuire aux performances du système.
Je pense que ce type de RAID est certainement approprié pour une station de travail et est probablement mieux fait en utilisant les contrôleurs embarqués peu coûteux. Du côté du serveur, la plupart de nos serveurs ont une certaine forme de matrice RAID pour le disque du système d'exploitation et les données sont alors sur une matrice distincte d'une forme appropriée. Je ne connais pas nos serveurs de production mais nos serveurs de développement (dont nous avons une bonne quantité) n'ont jamais eu de panne de contrôleur, nous avons eu des pannes de disques cependant. Dans un cas, la moitié de la baie de système d'exploitation a échoué sur une boîte SQL, alors qu'elle était en cours de reconstruction, l'autre disque a échoué! Parfois, RAID1 ne suffit pas!
la source
Pour vos postes de travail scientifiques, cela peut valoir la peine SI ces systèmes fonctionnent mieux avec leurs données stockées localement, par opposition à un partage sur un serveur de fichiers. Pour la population en général, je dirais que non. Cela ne vaut pas la peine et les maux de tête quand tout ce dont vous avez vraiment besoin est de restaurer les données qui doivent être conservées sur les partages.
la source
Le RAID n'est utile que lorsque vous ne pouvez absolument pas faire arrêter le serveur de manière inattendue. Nous utilisons RAID sur tous nos serveurs dans notre centre de données où il n'y a pas d'autre forme de redondance. Par exemple, nous n'utilisons pas de RAID sur nos serveurs Web, car 10 autres fonctionnent toujours.
Le test décisif est "si un disque se casse au milieu de la nuit et qu'il ne peut pas attendre jusqu'à 9h, il a besoin de RAID"
la source
Le RAID en vaut la peine lorsque vous avez un contrôleur alimenté par batterie.
Pour les applications serveur qui fdatasync () utilisent fréquemment des fichiers journaux (ce qui n'est pas rare dans les bases de données) pour plus de durabilité, vous finirez par écrire les mêmes blocs encore et encore. Cela tuera les performances d'E / S si vous n'avez pas de contrôleur alimenté par batterie.
Si vous avez un contrôleur avec batterie, la plupart des écritures n'atteindront même pas les disques, mais resteront simplement en mémoire jusqu'à ce qu'elles soient remplacées par une autre écriture. C'est une bonne chose.
La redondance est un bonus mais pas indispensable, car les choses importantes doivent être redondantes au niveau du système.
la source
Les implémentations RAID bon marché sont terribles.
Vos choix sont, par ordre de fiabilité:
Tout autre élément pose problème, et peut en effet entraîner une fiabilité globale inférieure à une solution non RAID.
Demandez-vous quoi faire si votre contrôleur tombe en panne et que le fabricant est en faillite.
Déterminez si vous pouvez récupérer après une panne apparente de double disque causée par des problèmes d'alimentation / de câblage.
Ce sont deux exemples parmi des centaines.
la source
Pour les postes de travail, le RAID n'en vaut probablement pas la peine par rapport à un nouveau système sur lequel les données peuvent être restaurées ...
Beaucoup parlaient de RAID 0 ... ce n'est pas là pour aider à la disponibilité. Vous doublez les chances d'échec du volume, car une fois qu'un lecteur meurt, vous perdez le tout. RAID 0 consiste à jouer avec la vitesse d'accès aux lectures / écritures sur un volume et à offrir plus de stockage. La seule façon dont cela pourrait aider dans un environnement professionnel est de prendre deux RAID 0 et de les mettre en miroir en tant que RAID 1.
RAID n'est pas une solution de sauvegarde, comme cela a été souligné.
Le RAID n'est pas non plus parfait. Je pense que cet article du blog de ce type résume ce que je pense du RAID et quand ça vaut le coup: Vous pensez au RAID?
Sur un poste de travail, vous devriez être en mesure d'amener une personne à utiliser un autre système pendant le déploiement d'un remplacement. Pourquoi utiliser RAID? Ses données doivent être stockées sur le serveur où la gestion, l'intégrité des données et les sauvegardes sont centralisées. La station de travail doit être configurée de manière à pouvoir être périodiquement mise à niveau ou modifiée selon les finances et le RAID n'est qu'une autre couche de coûts et de maux de tête à gérer (plus les problèmes d'utilisation d'énergie et de chauffage avec des lecteurs supplémentaires et l'imposition du flux d'air). Dans la majorité des cas pour les entreprises, il est probablement beaucoup plus rentable de placer l'argent d'une carte RAID dans un disque plus grand, et si vous utilisez un RAID intégré, vous aurez toujours des problèmes car il a tendance à lier le RAID format à la carte mère (et ce n'est pas vrai RAID de toute façon ... on le trouve dans les recherches Google comme "faux raid".
la source
Pourquoi s'embêter sur un poste de travail? Vous avez sûrement tous vos répertoires personnels et données stockés de manière centralisée. C'est là que vous souhaitez utiliser le raid.
la source
Si vous vous inquiétez de la défaillance d'un contrôleur de lecteur, vous devez également tenir compte de la défaillance du serveur - ventilateurs, carte mère, RAM, réseau ... et vous devez également tenir compte de la défaillance du routeur, du câblage et de l'alimentation ... et vous devez également tenir compte de la défaillance du centre de données (inondation, incendie, erreur humaine), puis de la défaillance du réseau externe (câbles coupés - tout le temps à certains endroits!).
En bref, vous pouvez vous soucier des temps d'arrêt du site au point de ne jamais vous soucier de mettre quoi que ce soit en ligne! Ou vous pouvez comparer le risque d'échec au coût de la redondance et obtenir une approche beaucoup plus réaliste. Et de toutes les choses que j'ai énumérées, le disque dur est le point de défaillance le plus probable.
À côté de l'erreur humaine, c'est. Qui tape "
shutdown -h now
" quand ils ont voulu redémarrer .... :(la source
Ma grande inquiétude est les disques, car il semble que vous ne puissiez pas acheter les bon marché:
Un fournisseur majeur note:
«La plupart des contrôleurs RAID sont conçus pour expirer une commande donnée si le lecteur de disque ne répond plus dans un délai donné. Le résultat sera que le lecteur apparaîtra hors ligne ou sera marqué comme mauvais et une alerte sera donnée au client. Les disques de classe entreprise (ou disques conçus pour les environnements RAID) ont une limite de nouvelle tentative avant qu'un secteur ne soit marqué comme mauvais. Cette limite de nouvelle tentative permet au lecteur de répondre au contrôleur RAID dans le délai prévu. Alors que les disques de bureau peuvent fonctionner avec un contrôleur RAID, la baie se déconnecte progressivement à mesure que le disque vieillit et peut entraîner une perte de données.
Cela me semble insensé, un autre problème qui garantit que les vendeurs de disques recevront beaucoup de retours de personnes qui ne savent pas mieux. Cependant, j'ai lu que Google a fait un livre blanc (je ne le trouve pas) qui montre qu'il n'y a pas de différence de fiabilité de lecteur entre les deux `` classes '' proposées par les fournisseurs de stockage. Je doute que Google utilise des contrôleurs RAID matériels dans leur flotte de boîtes beiges.
Peut-être que mdadm (dans linux raid) a des paramètres que l'on peut utiliser pour gérer les paramètres les plus impatients des firmwares de disques de bureau?
Peut-être qu'en réalité, tout le monde paie sa garantie à travers une période de «délai d'attente» dans le firmware du contrôleur?
la source