Ai-je besoin d'un deuxième contrôleur RAID pour la tolérance aux pannes?

9

J'ai un serveur avec 3 disques durs installés et une capacité totale de 6. Nous prévoyons de le maximiser, mais notre consultant a également suggéré d'obtenir un deuxième contrôleur RAID "pour la redondance" pour prendre en charge les nouveaux disques. Pour moi, cela n'a pas beaucoup de sens. Même avec un deuxième contrôleur RAID exécutant la moitié des disques, nous sommes toujours bloqués avec seulement la moitié de nos disques / programmes / données si l'un des contrôleurs meurt (ce qui n'est pas beaucoup mieux que de fonctionner avec aucun). Nous mettons vmware sur le serveur et il a vaguement mentionné certaines fonctionnalités avancées de tolérance aux pannes / basculement, mais si les disques sont inaccessibles en raison d'un contrôleur défaillant, comment est-il censé fonctionner?

Ne comptant que les raisons de la redondance et non les performances, pourquoi voudrais-je avoir un deuxième contrôleur RAID sur mon serveur?

Bigbio2002
la source
J'ai vu un historique lorsque le seul contrôleur RAID est tombé en panne, ce qui rend le stockage RAID multi-disques élevé qu'il a servi seul non seulement inutilisable mais même toutes les données qui y sont irrécupérables. Ce fut un coup dur pour l'entreprise. Finalement, la plupart des données ont été reconstruites à partir des fichiers trouvés sur les postes de travail. Honte totale. Toujours mettre en miroir les données sur le cluster de disques indépendant avec évidemment un autre contrôleur. Ne présumez jamais que RAID 6 vous sauvera la vie dans tous les cas si vous comptez sur une seule petite carte qui chauffe à 80 ° C tout en fonctionnant pendant de nombreuses années 7/24.
h22

Réponses:

11

Dans une conception `` haute disponibilité à boîtier unique '', alors oui, vous voudriez un deuxième contrôleur, idéalement sur un deuxième bus aussi. Mais ce type d'approche a cédé la place à une conception moins chère basée sur le clustering où une panne de boîte n'arrête pas le service. Cela dépend donc si vous prévoyez d'utiliser un environnement en cluster ou si vous comptez sur une seule boîte. Même si votre réponse est que ce dernier ayant deux contrôleurs peut être considéré comme ajoutant une complexité supplémentaire et peut-être excessif.

modifier - sur la base de votre commentaire sur l'utilisation d'ESXi sur votre autre question, je dois dire que son clustering est fabuleux , nous avons de nombreux clusters à 32 voies qui fonctionnent parfaitement.

Chopper3
la source
AFAIK, nous n'allons pas utiliser le clustering. En quoi un deuxième contrôleur dans une seule boîte me serait-il avantageux? Existe-t-il une chose telle que le basculement du contrôleur?
Bigbio2002
1
Pas dans un monde ESX / ESXi non - un seul serait bien, assurez-vous d'avoir un contrôleur qui fera une grande baie R10 de tous les 6 disques mais vous permettra de créer ces disques logiques de 2 To (ou moins) ok. La série Pxxx de HP vous permet de le faire.
Chopper3
7

Un deuxième contrôleur RAID activement utilisé n'est pas destiné à la redondance. Seulement s'il s'agit d'un contrôleur de secours à froid où vous basculez tous vos disques vers le premier meurt. Ensuite, vous avez une redondance (pour le contrôleur). Mais méfiez-vous de le faire, comme indiqué ici .

Le RAID est donc destiné à la redondance des disques conduisant à un seul point de défaillance au niveau du contrôleur. Avoir un deuxième contrôleur (inutilisé) peut résoudre ce problème car vous pouvez basculer tout le disque vers le nouveau. Si cela fonctionne dépend d'autres facteurs ...

Je ne suis pas un locuteur natif, mais pour moi, la "tolérance aux pannes" est quelque chose de différent de la "redondance". Un anglophone peut-il m'aider ici?

mailq
la source
La redondance est un moyen d'atteindre la tolérance aux pannes :). Je cherchais quelque chose dans le sens d'un serveur de secours ou d'un contrôleur de basculement. Est-ce une fonctionnalité prise en charge, ou devrais-je remplacer manuellement les cartes?
Bigbio2002
Je n'ai jamais vu de contrôleur où la commutation des disques se fait automatiquement. C'est soit parce que je ne l'ai pas cherché, soit parce que je ne peux pas imaginer comment vous devriez faire passer les câbles entre un disque et deux contrôleurs.
mailq
Les disques à double port sont assez courants dans les environnements d'entreprise (pensez aux étagères SAN) - mais les prix augmentent d'un facteur 2 ou 3, évidemment.
adaptr
3

Sur un seul boîtier, vous avez en fait besoin de deux contrôleurs RAID, connectés à deux complexes racine PCI-E différents, pour disposer d'une redondance complète du sous-système d'E / S. Ceci peut être réalisé par deux configurations différentes:

  • utilisez des disques SAS à double port coûteux, chaque liaison SAS étant connectée à un contrôleur différent. De cette manière, chaque contrôleur est connecté à chaque disque. De toute évidence, les deux contrôleurs ne peuvent pas fonctionner sur des disques en même temps; une certaine forme de verrouillage / clôture est nécessaire pour coordonner l'accès aux disques. SCSI a une disposition spéciale pour fournir le mécanisme de clôture nécessaire, mais ceux-ci doivent être coordonnés par un logiciel approprié. En d'autres termes, vous ne pouvez pas simplement connecter un disque à deux contrôleurs et l'appeler un jour; vous avez plutôt besoin d'une configuration logicielle appropriée pour le laisser fonctionner sans problème;
  • utilisez des disques SAS / SATA à liaison unique normaux et moins chers, en connectant la moitié à chaque contrôleur. Par exemple, avec 6 disques, vous devez connecter 3 disques à un contrôleur et 3 disques à un autre contrôleur. Sur chaque contrôleur, configurez une matrice RAID selon vos besoins (par exemple: RAID 5 ou RAID1). Ensuite, au niveau du système d'exploitation, vous pouvez configurer un RAID logiciel entre les deux baies de disques, pour obtenir une redondance complète des baies. Bien que moins chère, cette solution présente l'inconvénient supplémentaire de réduire efficacement de moitié la capacité de stockage (en raison du niveau RAID1 du logiciel).

Un problème clé avec les deux approches est que vous n'avez pas de redondance complète du système: un problème de carte mère / CPU peut faire tomber l'ensemble du système, indépendamment de la quantité de contrôleurs / disques dont vous disposez.

Pour cette raison, ce type de redondance in-a-box est rarement utilisé récemment (sauf dans les déploiements SAN milieu / haut de gamme); au contraire, la mise en miroir de cluster / réseau gagne du terrain. Avec la mise en cluster (ou la mise en miroir du réseau), vous disposez d'une redondance complète du système, car un seul système défaillant ne peut pas empêcher l'accès aux données. Évidemment, le clustering a ses propres pièges, donc ce n'est pas une balle facile / argentée, mais dans certaines situations, ses avantages ne peuvent pas être annulés. De plus, vous pouvez également utiliser la mise en miroir de réseau asynchrone pour avoir une redondance des données presque en temps réel sur un emplacement géographiquement différent, de sorte qu'un seul événement catastrophique ne fasse pas de ravages sur vos données.

shodanshok
la source
Avec certains types de données, la copie qui n'est qu'à moitié mise à jour (car la synchronisation a échoué à mi-chemin) peut être inutilisable. Une base de données est l'exemple typique, mais aussi divers codes source et ensembles de données avec beaucoup de petits fichiers qui dépendent étroitement les uns des autres.
h22
Cela dépend du mécanisme de réplication sous-jacent. DRBD, par exemple, permet d'utiliser une réplication synchronisée complète (protocole C) ou presque complète (protocole B). Cela signifie que lorsqu'une écriture est acquittée sur l'hôte source, elle est également validée sur l'hôte distant. En d'autres termes, les barrières d'écriture sont respectées sur les deux hôtes). Avec une telle garantie, tout système de fichiers / base de données robuste devrait récupérer sans problème.
shodanshok
Oui, certaines bases de données prennent en charge la réplication et certaines autres applications également. Ce sont évidemment beaucoup plus faciles à travailler.
h22
1

Vous auriez besoin de disques SAS à double port pour fournir un basculement réel sur plusieurs contrôleurs. Bien que ceux-ci existent, il est décidément peu coûteux - pas dans la fourchette de prix d'un seul serveur qui ne dispose que de stockage interne.

Ce sont des technologies souvent utilisées dans les systèmes SAN, où la mort du contrôleur est un vrai problème.

Pour un serveur unique sans autre capacité de basculement, un deuxième contrôleur ne gagnera rien - cela coûtera juste plus d'argent et fournira au consultant plus de bénéfices.

adaptr
la source