Ai-je besoin de cartes RAID Fusion-io?

27

Puis-je fonctionner de manière fiable avec une seule carte Fusion-io installée sur un serveur, ou dois-je déployer deux cartes dans une configuration RAID logicielle?

Fusion-io n'est pas très clair (presque trompeur) sur le sujet lors de l'examen de leurs supports marketing. Étant donné le coût des cartes, je suis curieux de savoir comment d'autres ingénieurs les déploient dans des scénarios du monde réel.

Je prévois d'utiliser la marque HP Fusion-io ioDrive2 carte 1.2To pour une solution de base de données autonome propriétaire fonctionnant sous Linux. Il s'agit d'une configuration à serveur unique sans véritable option de haute disponibilité. Il existe une réplication asynchrone avec un RPO de 10 minutes qui reflète les journaux de transactions vers un deuxième serveur physique.

Traditionnellement, je spécifierais un serveur HP ProLiant haut de gamme avec le processeur le plus performant pour cette application. Je dois passer au SSD et je peux acquérir Fusion-io à un prix inférieur à celui du SSD SAS d'entreprise pour la capacité requise.

  • Dois-je exécuter deux cartes ioDrive2 et les associer à un logiciel RAID (md ou ZFS), ou est-ce inutile?
  • Dois-je m'inquiéter davantage de l'échec de Fusion-io que de l'inquiétude d'une défaillance du contrôleur RAID ou d'une défaillance de la carte mère?
  • Les administrateurs système comme RAID. Cela nécessite-t-il un état d'esprit différent, compte tenu de l'interface différente et du niveau d'usure / correction d'erreurs sur la carte disponibles dans ce facteur de forme?
  • Quel est le taux de défaillance de ces appareils?

Edit: Je viens de lire un livre blanc sur la fiabilité Fusion-io de Dell, et le résultat à retenir semble être "Les cartes Fusion-io ont beaucoup de redondances internes ... Ne vous inquiétez pas du RAID !!" .

ewwhite
la source
Le raid logiciel et / ou le bus PCIe parviendront-ils même à suivre si vous repoussez la limite IOPS? Honnêtement, je n'en ai aucune idée, mais ça vaut le coup de vérifier.
pauska
1
Le bus PCIe continuera. Le RAID logiciel (si j'AI BESOIN de) sera basé sur ZFS, donc il est capable. J'ai commandé deux cartes pour l'instant, mais la littérature Fusion-io semble dire, "une carte est assez bonne".
ewwhite
Même ZFS doit utiliser des cycles de processeur pour refléter les données, il ajoute donc de la complexité et de la latence - mais il est impossible de dire dans quelle mesure cela affecterait votre application spécifique. Fusion semble être très fier de son faible coût CPU sur la mise en miroir / sauvegarde interne ..
pauska

Réponses:

16

En fin de compte, cela revient à votre modèle de défaillance. Quel est l'impact d'un échec?

Historiquement, nous avons toujours tout RAIDé car le coût de le faire a été négligeable. Un autre 500 $ pour un lecteur de mise en miroir? Ça vaut vraiment le coût sans même le considérer.

Lorsque vous parlez d'un autre 10 000 $ + pour activer la mise en miroir, il faut un peu plus de considération.


Non, vous n'avez pas besoin de refléter

Les cartes Fusion-io ont une assez bonne redondance interne. Ce n'est pas le genre de matériel où votre disque est une seule puce. Dans la plupart des situations où j'ai observé une défaillance, il s'agit d'un problème de micrologiciel qui a affecté les deux membres d'un miroir, donc le RAID n'aurait pas d'importance.

Considérez une carte Fusion-io comme un contrôleur RAID avec des disques derrière elle. Êtes-vous d'accord avec une configuration à un seul contrôleur? Probablement. Traitez-le comme ça.

Dans de nombreuses configurations où vous déploieriez des lecteurs Fusion-io, vous aurez d'autres protections intégrées (redondance au niveau du nœud), donc cela n'a pas autant de sens.


Oui, vous devez refléter

RAID augmente votre disponibilité . Avez-vous besoin d'une disponibilité maximale absolue malgré le coût? Le coût d'une panne et des éventuels temps d'arrêt est-il cher? Allez-y et mettez en miroir les disques. Dans une configuration statistiquement volumineuse, vous aurez des pannes de disques malgré les protections internes.

MikeyB
la source
Mise à jour: j'ai mis en miroir les cartes Fusion-io dans les installations où le client était d'accord avec les dépenses supplémentaires (et pour me faciliter le déploiement du produit). J'ai déployé un certain nombre d'installations à carte unique dans d'autres situations. Tout s'est bien passé jusqu'à présent ...
ewwhite
18

La redondance sur l'appareil devrait très bien faire le travail pour les défaillances des puces flash - analogue à RAID parmi tous les composants qui font le stockage de données réel.

Dois-je m'inquiéter davantage de l'échec de Fusion-io que de l'inquiétude d'une défaillance du contrôleur RAID ou d'une défaillance de la carte mère?

Une panne de l'ensemble du périphérique serait à peu près analogue à la perte d'un contrôleur RAID ou d'une carte mère - je serais à peu près aussi inquiet pour la carte Fusion-io que ces autres composants à point de défaillance unique, bien que je ne le fasse pas '' t avoir une expérience avec les appareils à grande échelle pour pouvoir comparer les taux de défaillance en utilisant des données dures.

Dois-je exécuter deux cartes ioDrive2 et les associer à un logiciel RAID (md ou ZFS), ou est-ce inutile?

Ajouter la redondance en plus de ce que le périphérique possède déjà (par exemple, RAID logiciel parmi plusieurs cartes Fusion-io) reviendrait à faire du RAID logiciel entre deux groupes RAID matériels sur deux contrôleurs RAID différents; pourrait être utile pour les systèmes garantissant une redondance extrême pour supprimer un point de défaillance unique supplémentaire, mais pas pour les déploiements courants (un RPO de 10 minutes sur un miroir devrait être suffisant pour la plupart des applications?).

Des administrateurs système comme RAID. Cela nécessite-t-il un état d'esprit différent, compte tenu de l'interface différente et du niveau d'usure / correction d'erreurs sur la carte disponibles dans ce facteur de forme?

Ouais je pense que oui. Vous obtenez essentiellement un périphérique qui ressemble à un contrôleur RAID et un tas de périphériques de stockage derrière lui dans un seul paquet. Il est certainement tentant de s'inquiéter de placer vos données sensibles sur un seul appareil, mais il faut avoir un certain niveau de confiance dans la redondance interne de l'appareil ... Ce qui devrait être contrebalancé par une bonne compréhension du "RAID n'est pas un concept de sauvegarde : toujours être prêt à faire face à la défaillance d'un composant redondant, ou à un utilisateur de supprimer les données qu'il contient, avec de bonnes sauvegardes.

Shane Madden
la source
13

Comme vous le savez, nous avons utilisé leur kit pendant un certain temps, dans les configurations RAID et non RAID - j'aurais aimé avoir une expérience d'échec à vous offrir, mais je ne l'ai pas fait. Nous n'avons eu aucun échec avec lequel RAID aurait aidé et leurs fonctionnalités de résilience intégrées ne font que s'améliorer. De plus, la fonction principale pour laquelle nous les utilisons est désormais mise à l'échelle / clusterisée horizontalement, nous avons donc encore moins de raisons de les RAID. Excellentes cartes cependant, je les recommande vivement.

Chopper3
la source
Un bon point de données. Cependant, je ne peux pas dire si l'ajout d'une couche RAID est excessif ou non.
ewwhite
1
Je considère que la technologie n'est pas le point déterminant ici - soit vos données doivent pouvoir prendre en charge la perte d'une seule carte FusionIO, soit ce n'est pas le cas - pensez-y simplement comme des disques rapides et coûteux - cela ne change pas si vous peut vivre sans RAID ou pas vrai?
Chopper3
Légèrement ... Une approche traditionnelle serait d'utiliser des SSD SAS d'entreprise dans un RAID 1 + 0. C'est simplement appliquer la même norme que celle utilisée pour faire tourner les disques sur les SSD. Mais cela suppose également le remplacement à chaud. Cela ne s'applique pas à une carte PCIe, en particulier lorsque je serais obligé d'utiliser un logiciel RAID pour y parvenir. Étant donné que Fusion-io a également l'avantage de mieux niveler et surveiller l'usure, j'essaie de comprendre les modes de défaillance réalistes impliqués ici. Dois-je traiter le Fusion-io comme un disque ou un contrôleur? Vous ne mettriez pas deux cartes Smart Array dans un ProLiant pour servir des disques internes, non?
ewwhite
2
@ewwhite Vous pouvez avoir deux contrôleurs RAID avec des disques différents et RAID1 entre les disques des contrôleurs, si vous devez être en mesure de gérer la défaillance d'un contrôleur RAID. Je dirais que la carte Fusion-io est un contrôleur RAID en termes de planification de redondance.
Shane Madden
@ewwhite Si vous regardez le libellé que j'ai utilisé, vous pouvez lire entre les lignes que nous avons eu une panne sur un seul serveur équipé de FusionIO - nous avons eu un mobo go pop - un DL580 G6 (nous en avons très peu) et quelque chose est arrivé à une banque de mémoire entière et il a enlevé le conseil d'administration. Dans ce scénario, c'était RAID 1, mais cela n'avait évidemment pas d'importance. Bien sûr, gardez à l'esprit que PCIe peut être remplaçable à chaud, cela peut être un problème énorme mais cela peut fonctionner correctement.
Chopper3
9

Je ne connais pas directement Fusion, mais j'ai une certaine expérience SSD PCIe à partir de laquelle travailler.

Ceux avec lesquels je travaille présentent quatre LUN différents au système d'exploitation et traitent la carte PCIe comme un HBA. Si je veux du RAID, je mettrais en miroir deux LUN ensemble en utilisant le système d'exploitation. Cela me permet une solution à une carte pour la redondance. Cependant, si la carte échoue, je suis toujours dans un ruisseau. Je ne sais pas si ioDrive fait la même chose.

sysadmin1138
la source
Cette unité particulière présentera un périphérique bloc.
ewwhite
1
Les ioDrives présentent un ou deux appareils indépendants. S'il en présente deux, il s'agit physiquement de deux appareils distincts sur une même carte chacun avec sa propre protection interne. Comparez, disons, à l'Intel 910 qui présente chacun quatre appareils qui doivent être traités comme un SSD.
MikeyB
5

J'ai acheté 6 des cartes 1,2 To au cours des derniers mois. L'un d'eux a déjà échoué. Donc je les ferais absolument un raid. J'ai utilisé le miroir de disque actif de Windows. Le lecteur a échoué avec le message "carte LEB manquante". On m'a dit qu'il faudrait l'échanger. Mais pour obtenir l'approbation RMA, je devrais prendre des photos des deux côtés de la carte défectueuse (nécessitant une interruption de production pour retirer la carte). Et puis ils m'ont dit que la carte de remplacement était en rupture de stock sans ETA. Donc, vous voudrez peut-être réfléchir sérieusement avant de les acheter.

user229000
la source
Merci d'avoir partagé votre expérience. Je suis allé de l'avant et j'ai déployé ces cartes de 1,2 To par paires en miroir. J'utilise HP SKU, j'ai donc mon contrat de support HP pour gérer RMA / remplacement.
ewwhite