J'ai un serveur HP ProLiant DL380 G7 fonctionnant comme unité de stockage NexentaStor . Le serveur possède 36 Go de RAM, 2 contrôleurs LSI 9211-8i SAS (pas d'extensions SAS), 2 lecteurs système SAS, 12 lecteurs de données SAS, un disque de secours, un cache Intel X25-M L2ARC et un accélérateur DDRdrive PCI ZIL. Ce système sert NFS à plusieurs hôtes VMWare. J'ai également environ 90 à 100 Go de données dédupliquées sur la baie.
J'ai eu deux incidents où les performances ont soudainement chuté, laissant les invités VM et les consoles Nexenta SSH / Web inaccessibles et nécessitant un redémarrage complet de la baie pour restaurer les fonctionnalités. Dans les deux cas, c'est le SSD Intel X-25M L2ARC qui est tombé en panne ou a été "déconnecté". NexentaStor n'a pas réussi à m'alerter sur l'échec du cache, mais l'alerte ZFS FMA générale était visible sur l'écran de la console (ne répond pas).
La zpool status
sortie a montré:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Cela n'a déclenché aucune alerte depuis Nexenta.
J'avais l'impression qu'une panne de L2ARC n'aurait pas d'impact sur le système. Mais dans ce cas, c'était sûrement le coupable. Je n'ai jamais vu de recommandations pour RAID L2ARC. La suppression complète du mauvais SSD du serveur m'a remis en marche, mais je m'inquiète de l'impact de la panne de l'appareil (et peut-être du manque de notification de NexentaStor également).
Modifier - Quel est le SSD actuellement le meilleur choix pour les applications de cache L2ARC de nos jours?
Réponses:
ZFS ne fait pas d'E / S disque, les pilotes de périphériques ci-dessous ZFS font d'E / S disque. Si le périphérique ne répond pas en temps opportun, ou comme dans ce cas, perturbe tous les autres périphériques sur le module d'extension, il n'est pas visible comme une défaillance de ZFS. Tout ce que ZFS voit est une E / S lente.
Il existe un bogue dans le micrologiciel Intel X-25M qui affecte leur comportement lors de fortes charges et peut provoquer des tempêtes de réinitialisation. Ce problème affecte tous les OS et ne peut pas être résolu au niveau de la couche OS. Veuillez contacter votre fournisseur de matériel pour des correctifs ou des corrections.
Si une lecture est censée être satisfaite par le L2ARC, alors la lecture y sera tentée. ZFS s'appuie ensuite sur les pilotes de couche inférieure pour signaler une erreur. Dans ce cas, le lecteur continue de se réinitialiser et de réessayer jusqu'à 5 minutes avant de déclarer que les E / S ont échoué, en fonction du pilote, du périphérique et des paramètres de délai par défaut. Ce n'est qu'après que les pilotes de couche inférieure ont déclaré que les E / S ont échoué que ZFS réessaiera sur le pool.
Les coureurs de vérification du volume et de vérification du disque de NexentaStor recherchent des messages d'erreur supplémentaires et vous alertent par e-mail et journalisation des pannes. Le runner de vérification de disque a été amélioré dans la version 3.1 pour vous avertir spécifiquement des conditions exposées par un firmware cassé dans les SSD.
Conclusion: votre matériel est défectueux et devra être réparé ou remplacé.
la source
Connectez-vous le SSD X25-M au fond de panier? Il y a un problème connu avec Nexenta et l'accès au L2ARC via un fond de panier. Le mieux est de connecter le SSD directement dans un port SATA de la carte mère. Assurez-vous qu'il est également configuré pour utiliser AHCI.
Si vous exécutez quelque chose de critique sur ce serveur, je passerais à un SSD SLC (comme le X25-E ou un SSD STEC). Cela étant dit, vous serez probablement d'accord avec le X25-M si ce n'est pas le cas.
la source
Ed, il y en a plusieurs que vous pouvez utiliser, allant d'un prix relativement raisonnable à un sacré sacré. Je préfère déployer les SSD SAS dans tous les cas et j'ai très bien fait avec STEC et Pliant. Les deux offrent maintenant un lecteur MLC qui fonctionnera avec un périphérique L2ARC. L'offre SSD de Seagate qui n'est pas encore testée mais qui arrive bientôt est SLC SAS 2.0 et selon les rumeurs, elle n'est "pas chère". Restez à l'écoute....
-PB
la source