voici ma situation.
J'ai un serveur Dell avec un contrôleur Dell Perc 7i (contrôleur LSI).
J'avais un lecteur qui m'a donné un avertissement de panne prévue, j'ai donc appelé leur support et ils sont sortis et ont remplacé le disque et la baie se reconstruit elle-même, assez standard.
Deux semaines plus tard, j'ai un autre disque me donnant l'avertissement de panne prévue. J'ai pensé que c'était peut-être un mauvais lot de disques ou une coïncidence, etc. Je contacte donc le support et regarde plus en profondeur. Je me rends compte qu'il y avait des blocs défectueux sur l'un des autres disques qui n'ont pas échoué et ces blocs défectueux ont été copiés pendant la reconstruction. Alors maintenant, j'ai de mauvais blocs partout et ils tuent lentement mon tableau. J'en suis venu à découvrir que cela s'appelle un tableau perforé.
Leur conseil était donc de remplacer tous les disques, de reconstruire la baie et de restaurer à partir d'une sauvegarde. Sauf que j'ai ce problème depuis quelques semaines, ce qui signifie que mes sauvegardes sont mauvaises ... et si je restaure à partir d'une sauvegarde précédente (il y a un mois), il me manquera environ 4 semaines de données de ma base de données qui est totalement inacceptable pour notre bureau.
Ma question est ... quelqu'un a-t-il déjà récupéré de quelque chose comme ça sans avoir à perdre de données ou sans l'approche globale (jeter tout par la fenêtre et recommencer)?
J'ai trouvé un lien qui couvrait mon scénario, je ne sais pas s'il éclaire la situation: http://www.theprojectbot.com/raid/what-is-a-punctured-raid-array/
Toute aide ou orientation serait appréciée ! Qu'en pensez-vous?
la source
À cet instant, procédez comme suit:
Espérons que les disques soient encore assez bons pour que vos données soient intactes, et vous ne rencontrerez aucun problème lors de l'exécution de la nouvelle sauvegarde complète.
Ensuite, supprimez ces disques et créez une nouvelle matrice RAID. Une fois que c'est prêt, essayez de restaurer à partir de la sauvegarde que vous venez de faire. Avec un peu de chance, ce sera tout ce que vous aurez à faire.
Si cela échoue, essayez le plus ancien suivant, le plus ancien suivant, etc. Assurez-vous de tester la fonctionnalité du système - ce n'est pas parce qu'il démarre qu'il est pleinement opérationnel. En particulier, testez la corruption des bases de données.
Si vous deviez restaurer le système entier à partir d'une sauvegarde plus ancienne, c'est ok. Prenez les dernières sauvegardes et restaurez uniquement les fichiers de base de données et autres fichiers importants. Testez-les pour vous assurer qu'ils fonctionnent correctement. Encore une fois, si cela échoue, essayez le plus ancien suivant.
L'utilisation de ce processus minimise la perte de données.
la source
Les réponses fournies par Grant et Nathan C sont excellentes en ce qui concerne la façon dont vous devez procéder pour gérer les sauvegardes / restaurations et traiter l'intégrité des données.
Voici quelques détails plus clairs sur la façon de gérer l'ensemble RAID quand vient le temps de recréer le disque virtuel et de restaurer à partir de la sauvegarde:
Remarque : Si vous avez utilisé RAID5, vous devriez sérieusement envisager d'utiliser RAID6 cette fois. RAID5 n'est pas fiable pour les données critiques de l'entreprise selon les meilleures pratiques actuelles de l'industrie sur une baie de cette taille. Les disques SATA / NL-SAS de grande capacité ont également un risque plus élevé de rencontrer un URE pendant les reconstructions, ce qui entraîne une perforation comme celle avec laquelle vous avez affaire. RAID6 réduit considérablement ce risque et est généralement acceptable pour les données critiques avec les capacités de disque actuellement disponibles.
la source