Nous avons un RAID-6 à 16 disques qui a trois disques à problème. Deux sont déjà morts et le troisième donne des avertissements SMART. (Peu importe comment il est devenu dans un si mauvais état.)
Évidemment, nous voulons remplacer les disques morts avant celui qui fonctionne toujours, mais est-il préférable de:
remplacez un disque mort, laissez le RAID reconstruire, puis remplacez l'autre et laissez-le reconstruire à nouveau; ou
remplacer les deux disques en même temps et le laisser reconstruire les deux en parallèle?
En d'autres termes, allons-nous revenir plus rapidement à un état de redondance en réintroduisant un ou deux disques? La reconstruction de deux disques en parallèle ralentit-elle le processus de reconstruction?
En cas d'importance, le contrôleur est un 3ware 9650SE-16ML.
la source
Réponses:
!!!!! UNE !!!!!
Faites-le un à la fois, sérieusement mec, ne pensez pas à faire ça de toute autre manière, ok.
Tout le reste mettra à l'épreuve vos compétences de restauration complète du système.
la source
Avez-vous de bonnes sauvegardes récentes? Sinon, pensez-vous pouvoir les obtenir dans un délai raisonnable?
Honnêtement, je serais plus préoccupé par le déclenchement du mauvais disque hors ligne lors d'une reconstruction que toute autre chose - Si vous lancez déjà des erreurs SMART, vous êtes plus qu'à mi-chemin.
Ma suggestion serait de confirmer vos sauvegardes, puis de reconstruire un disque à la fois pour essayer de récupérer dans un état où vous pouvez remplacer celui qui génère des erreurs SMART (disques morts en premier, erreurs logicielles en dernier).
Si vous n'avez aucune sauvegarde, c'est une séance de merde: la sauvegarde peut créer suffisamment d'erreurs logicielles pour marquer le lecteur marginal comme ayant échoué, tout comme une tentative de reconstruction.
la source
Je ne vois aucun intérêt à le changer en "un disque à la fois".
De toute évidence, si le RAID est capable de "resilver" les deux disques simultanément ( qui sont de toute façon défaillants ), vous gagnez seulement en permettant au RAID entier de retrouver sa capacité à supporter jusqu'à 2 échecs plus rapidement .
la source
Mon 0.02. $
Le serveur étant déjà hors ligne, exécutez ddrescue sur le lecteur qui est sur le point de tomber en panne, pour le cloner sur un autre lecteur sain.
Ensuite, placez le nouveau disque sain dans le module RAID. Si le clonage réussit, vous éviterez le risque de voir ce disque tomber en panne pendant 2 reconstructions.
la source