À quoi sert la batterie sur un contrôleur RAID de mise en cache avec batterie de secours si le serveur est sur une alimentation sans coupure?

10

La batterie est-elle redondante si le serveur est sur un onduleur de taille appropriée? Il existe une option pour forcer le mode d'écriture différée et je veux comprendre le risque. Je crois comprendre que cela aide contre les pannes de courant alors que les données du cache n'ont pas été écrites sur le disque physique. Mais si le serveur est sur un onduleur, il n'y a aucun risque de perte d'alimentation, surtout s'il s'agit d'un onduleur intelligent et que le serveur est configuré pour s'éteindre correctement lorsque la batterie atteint un état bas. Suis-je en train de manquer quelque chose?

RPC
la source

Réponses:

22

Votre compréhension est essentiellement correcte.

Autoriser le contrôleur à mettre en cache les données d'écriture dans sa RAM locale améliore la vitesse d'écriture, mais cela vous expose au risque de voir le système d'exploitation penser que les données ont été écrites sur le disque (car le contrôleur en a) et d'avoir une panne de courant avant que le contrôleur termine cette écriture . La sauvegarde de la batterie permet aux données du cache de survivre jusqu'à la remise sous tension de la machine, ce qui atténue ce risque.

En ce qui concerne l'avantage si votre système est déjà sur un onduleur, que se passe-t-il si vous dépassez le temps d'exécution de votre onduleur (possible même avec un onduleur intelligent), ou si les alimentations du serveur explosent? Ou si quelqu'un arrache accidentellement les cordons d'alimentation?
Beaucoup de choses peuvent provoquer une panne de courant. Un onduleur ne protège que de quelques-uns d'entre eux.

voretaq7
la source
14
Les câbles d'alimentation soudainement tirés sont un risque dans la plupart des centres de données!
sysadmin1138
1
Bing sur tous les points. Le coût d'un BBWC en vaut la peine, à moins que les données ne soient vraiment transitoires, vous pouvez capturer l'événement et récupérer d'une autre manière, et vous voulez simplement améliorer les performances en forçant la mise en cache en écriture différée.
mfinni
3
Aucun risque de coupure de courant? Outre les réponses de voretaq7, ajoutez également: déclenchement du disjoncteur, dysfonctionnement de l'onduleur ... il y a beaucoup de choses qui peuvent mal tourner.
MikeyB
@mikeyB bon point sur les disjoncteurs - Je suis allé dans au moins un DC où les jambes de puissance A / B sont parfois retournées à un étage ou un disjoncteur
voretaq7
Merci à tous pour vos réponses. @ voretaq7 - le serveur a également plusieurs alimentations, plusieurs cordons d'alimentation, un onduleur ainsi qu'un générateur, mais je vois votre point de vue en termes de conception de la carte elle-même (ne sachant pas dans quelle boîte elle peut se retrouver). @mfinni - c'est une bonne chose, mais nous aurions alors de plus gros problèmes avec les milliers de serveurs qui tomberaient en même temps.
RPC
8

Il y a deux raisons à la batterie;

  • Que se passe-t-il si votre PSU / s devient soudainement pop - quel que soit l'onduleur, votre système est mort et que vous ayez peut-être des données non validées dans votre cache, le fait d'avoir la batterie garantit que les données sont correctement écrites lorsque l'alimentation est rétablie. La même chose est vraie si vous avez eu une panne de la carte mère bien sûr.
  • Que faire si quelque chose est mort sur votre contrôleur de disque, vos câbles ou votre ou vos boîtiers de disques? - dites quelque chose accroché au câble et endommagé le connecteur à chaque extrémité - encore une fois, vous pouvez avoir des données dans votre cache en attente d'écriture, mais aucun moyen de le faire car la carte, le câble, le boîtier, etc. est mort. Vous devrez peut-être remplacer le contrôleur, si vous avez un cache sauvegardé par batterie, vous pouvez déplacer ce cache vers une nouvelle carte sans perdre les données.

Ce sont deux bonnes raisons, mais pour être honnête, les caches basés sur le flash ont récemment pris le relais des caches sur batterie pour des raisons évidentes et je les recommanderais d'abord - cela dit, si vous écrivez beaucoup, je recommanderais l'un ou l'autre juste un UPS.

Chopper3
la source
-1

La batterie permet également d'avoir la performance améliorée ainsi que les objectifs notés par voretaq7. Retirez la batterie et l'appareil fonctionnera toujours mais à une vitesse considérablement réduite.

Mitch
la source
3
Ce n'est précisément pas correct dans ce cas. @RPC indique explicitement qu'il peut forcer la mise en cache en écriture différée sans la batterie de son contrôleur. La mise en cache en écriture différée améliore les performances.
mfinni
En fait, je suis sûr qu'il le peut, mais la batterie améliore considérablement les performances. J'ai travaillé sur le dépannage des performances dégradées sur une paire de périphériques de stockage HP MSA 20 et la dégradation a été causée par une batterie de cache d'écriture différée défaillante. La batterie a été remplacée et les performances ont bondi.
Mitch
2
Oui je sais. Parce que sur ces machines, la présence de la batterie permet la mise en cache d'écriture. Lorsque la batterie tombe en panne, la mise en cache en écriture s'arrête et les performances diminuent. Lorsque la batterie est réparée, la mise en cache en écriture recommence et les performances s'améliorent. Son contrôleur lui permet de forcer la mise en cache en écriture différée, ce qui améliore les performances , sans la batterie.
mfinni
Mitch, c'est une préoccupation très spécifique, je connais très bien les contrôleurs HP E / P / i et pour ces cartes, vous avez raison car HP rend très difficile l'activation du cache sans batterie - mais cette question n'est pas limitée à ces cartes et il y en a beaucoup qui vous permettent d'activer le cache sans batterie ou de le faire par défaut - d'où l'inquiétude de mfinni.
Chopper3
-1

Si vous avez un onduleur, vous pouvez forcer le cache et ne pas utiliser la pâte lors du raid. Si vous perdez de l'énergie sans carte de raid, vous pouvez obtenir des données corrompues, c'est à cela que servent les sauvegardes.

Et ce n'est pas parce que vous avez perdu de l'énergie que votre système est grillé. Le cache ne contient que 256 Mo et il est vidé / écrit en HD tout le temps lorsqu'il est inactif. Ce n'est pas comme s'il contenait toutes les données et ne les lâche jamais. Son toujours rincé.

Un météore pourrait frapper le bâtiment et tout exploser, ne vous laissez pas abattre par ce moût inquiet. J'ai exécuté le raid 1 avec cache et sans batterie sans problème.

Vous pouvez devenir vraiment anal dans cette conversation. Pourquoi ne pas avoir 4 fois plus de serveur, 10 sauvegardes, etc., etc. Ce n'est pas si grave.

Activez le cache et utilisez votre UPS. Si vous avez un coup ps, vous pouvez récupérer les données et il devrait souffler pendant les heures de travail avec quelqu'un utilisant l'ordinateur et avoir la bonne application ouverte, et sauvegarder les données en même temps, etc. etc. Les chances sont donc faibles, et si cela arrive, il peut être réparé facilement.

RAJ
la source