À quelle fréquence dois-je nettoyer mon RAID?

13

En général, j'aimerais savoir à quelle fréquence une matrice RAID doit être nettoyée. Qu'est-ce qui contribue à la nécessité de nettoyer plus souvent (lecture des données?, Écriture des données?, Arrêts inattendus?, Âge du lecteur?, Taille du lecteur?, Nombre d'utilisateurs?, Etc.)?

J'ai lu le wiki Arch ici et tout ce qu'il dit vraiment, c'est que le nettoyage doit être fait régulièrement. Je me demandais juste à quel point cela suffit régulièrement. Évidemment, cela dépendrait, mais quelle est une plage raisonnable? Annuel? Mensuel? Hebdomadaire? Du quotidien? Merci beaucoup pour toute information.

mrfred
la source
1
Quelle est la taille de votre baie? Combien de temps dure un nettoyage de votre baie? Les tableaux plus grands peuvent prendre des heures ou des jours pour un gommage complet. De toute évidence, vous ne pouvez pas frotter plus fréquemment qu'il ne faut pour qu'un seul gommage se termine. Le paquet Debian inclut un script cron qui s'exécute le premier dimanche de chaque mois.
Zoredache
Je dépend à quel point c'est sale :)
metacom
@Zoredache: C'est exactement le genre de choses que je cherchais. Étant donné que les baies plus grandes prennent plus de temps, cela réduirait-il la fréquence que vous devriez nettoyer? L'augmentation du nombre d'utilisateurs augmenterait-elle cette fréquence? Avez-vous besoin de nettoyer si vous n'écrivez pas vraiment beaucoup de nouvelles données?
mrfred
RAID logiciel? RAID matériel? ZFS?
ewwhite

Réponses:

15

La fréquence à laquelle vous devez scanner dépend de beaucoup de choses.

  • Âge des disques. Plus ils sont âgés, plus ils sont susceptibles de contenir le mal .
  • La qualité d'origine des disques en question. Les produits vendus en tant qu'entreprise sont plus susceptibles de durer sans erreur, et les disques de taille 1 + To de 2014 sont beaucoup plus fiables que leurs équivalents de 2009 lorsqu'ils étaient expédiés.
  • La sensibilité de vos E / S de production aux E / S de nettoyage.
  • Quelle partie de votre ensemble de données vous considérez comme votre ensemble de travail.

Les fournisseurs de matériel RAID incluent souvent un processus de nettoyage en arrière-plan pour cette raison, certains vous permettent même de régler la priorité d'E / S du processus de nettoyage, ce qui vous permet d'éviter (ou de réduire considérablement) la pénalité d'E / S de production pour un nettoyage. Bien sûr, si votre priorité est faible et que vos E / S prod exécutent les disques presque entièrement, vous ne terminerez probablement jamais un nettoyage et ne le remarquerez même pas jusqu'à ce que vous obteniez un échec.

Malheureusement, je ne sais pas si le noyau Linux dépriorise les E / S de nettoyage ou non. Quoi qu'il en soit, c'est une bonne idée de le tester avec vos charges de production pour vous assurer que tous les résultats sont acceptables. Si c'est acceptable, tant mieux! Si ce n'est pas le cas, vous pouvez choisir d'ajouter ou non des broches pour autoriser les E / S scrub + prod ou simplement accepter le risque d'échecs possibles de la baie en cours de route.

Une autre chose qui affecte la fréquence de nettoyage est le modèle d'utilisation des E / S. Si les charges de production ne touchent qu'une minorité des disques, la seule E / S qui trouverait normalement un mauvais bloc dans la partie inactive serait votre scrub; dans ce cas, vous voulez frotter plus souvent. Si vos charges de production lisent régulièrement l'intégralité de l'ensemble de disques (comme les sauvegardes complètes quotidiennes), les E / S de production vont tomber plus tôt sur les problèmes et vous pouvez nettoyer moins souvent.

Un bon plan d'action serait:

  1. Exécutez des tests pour voir si le nettoyage entravera la production.
    1. Calculez combien de temps un gommage complet prend pendant que vous y êtes.
  2. Déterminez quel pourcentage de votre jeu de disques obtiendra plusieurs accès au cours d'une semaine donnée (incluez les E / S de sauvegarde, le cas échéant, dans ce calcul).
  3. Sur la base de 1 et 2, décidez si vous êtes dans le camp le moins souvent ou le plus souvent.

Une fois que vous avez ces données ...

  • Si une analyse complète prend moins d'une journée et n'a pas d'impact notable sur la production, vous pouvez y aller aussi souvent qu'une fois par semaine.
  • Si une analyse complète prend moins d'une journée et a un impact sur la production, déterminez quelle partie de votre semaine / mois est la moins affectée et essayez de l'exécuter.
  • Si une analyse complète prend plus d'un jour mais moins d'une semaine et n'a pas d'impact sur la production, exécutez-la aussi souvent qu'une semaine sur deux ou tous les deux mois.
  • Si une analyse complète prend plus d'une journée mais moins d'une semaine et affecte la production, envisagez d'ajouter des ressources pour lui permettre d'être exécutée, d'exiger que les analyses soient exécutées pendant les fenêtres de maintenance organisées, ou profitez de la capacité inactive / de vérification du nettoyage à faire il s'ajuste et démarre continuellement.
  • Si un scan complet prend plus d'une semaine, une fois par mois suffit souvent. Mais si cela a un impact sur la production, vous devrez ajouter des ressources pour lui permettre de se terminer.
sysadmin1138
la source