Je veux construire un serveur de stockage et acheté 10 x 2TB WD RED's
. Le HDD's
vient d'arriver.
Y a-t-il un outil que vous utilisez pour vérifier les mauvais disques ou pour mieux vous défendre contre la mortalité infantile avant de copier des données réelles sur vos disques?
Est-il préférable de vérifier chaque single HDD
ou de tester le tableau ( ZFS raid-z2
) en copiant beaucoup de données dessus?
Réponses:
J'ai eu la même question il y a 2 mois. Après l'envoi d'un disque défectueux, le disque de remplacement est tombé en panne dans mon NAS après 3 jours. J'ai donc décidé de tester le nouveau remplacement avant de le mettre en production. Je ne teste pas chaque nouveau disque que j'achète, uniquement sur des disques «reconditionnés», auxquels je ne fais pas entièrement confiance.
Si vous décidez de tester ces disques, je vous recommande d'exécuter une analyse des blocs défectueux et un test SMART étendu sur le tout nouveau disque dur.
Sur un disque de 2 To, cela peut prendre jusqu'à 48 heures. La commande badblock écrit le disque complet avec un motif, puis relit les blocs pour voir si le motif est réellement là, et répétera cela avec 4 motifs différents.
Cette commande n'affichera probablement aucun bloc défectueux sur un nouveau disque, car les disques réallouent les blocs défectueux de nos jours.
Donc, avant et après cela, j'ai exécuté un test intelligent et vérifié le nombre de secteurs en attente réaffecté et actuel. Si l'un d'entre eux a augmenté, votre disque contient déjà des blocs défectueux et peut donc s'avérer indigne de confiance.
Après cela, je lance à nouveau un test SMART étendu.
Vous voudrez peut-être installer d'abord smartctl ou smartmontools.
Attention , l'indicateur badblocks -w écrasera toutes les données sur votre disque, si vous voulez juste faire une vérification de lecture, sans écraser le disque, utilisez
badblocks -vs /dev/sdX
Si après cela, vos valeurs intelligentes semblent correctes, je ferais confiance au disque.
Pour savoir ce que signifie chaque valeur intelligente, vous pouvez commencer à chercher ici
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
la source
Ce sont de nouveaux disques. Soit ils vont échouer, soit ils ne le feront pas. Vous avez déjà une longueur d'avance en utilisant le système de fichiers ZFS, qui vous donnera un excellent aperçu de la santé de votre raid et de votre système de fichiers ...
Je ne ferais rien de plus que de simplement construire le tableau. C'est le point de la redondance. Vous ne pourrez pas provoquer une panne de disque avec les autres méthodes répertoriées.
la source
Vous pouvez utiliser Bonnie ++ pour les tests. Il peut parfaitement émuler le modèle de comportement du serveur de fichiers.
Par exemple:
Le test s'exécutera en tant qu'utilisateur «personne» et créera / réécrira / supprimera 100 * 1024 fichiers, de 200 à 150000 octets par fichier, dans 100 répertoires créés automatiquement ci-dessous / home / tmp. Et nombre de tests = 300. Vous pouvez jouer sur le nombre / taille de fichiers et le nombre de répétitions de tests.
la source
En général, je fais juste une init RAID complète et, le cas échéant, commence à remplir le système de fichiers pendant cela, tout en sachant qu'il pourrait y avoir un problème en raison de lecteurs morts. De cette façon, je ne perds pas de temps pour des tests qui ne sont pas fiables de toute façon et j'attraperais immédiatement les vrais disques faibles. Après cela, il pourrait y avoir encore un risque élevé de panne de disque en raison de la «mortalité infantile», mais il n'y a aucun moyen pratique d'éliminer cela.
Dans la pratique, aucun des derniers centaines de disques que j'ai utilisés dans un RAID n'a rencontré de problème au cours de la première année de fonctionnement.
la source
Je travaille pour une entreprise qui fait ce genre de test jour après jour. Et oui, nous testons chaque disque dur que nous achetons. Notre processus commence par l'exécution des lecteurs via un programme DOS gratuit appelé HDAT2. C'est gratuit à télécharger. Il peut accéder à SMART et à certaines autres fonctionnalités du lecteur qui sont inaccessibles à partir d'un environnement Windows. En fonction des résultats, nous les exécuterons sur l'une des différentes gammes de matériel spécialisé, mais au fond, ils exécutent principalement un autotest court SMART, un test long, un effacement sécurisé et une lecture complète pour vérifier les secteurs. Ma suggestion serait d'exécuter un effacement sécurisé du disque complet, puis d'exécuter une lecture complète, puis un autotest court SMART. Cet ordre est important car un court auto-test peut ne rien trouver s'il est exécuté au début de votre test, mais après une écriture et une lecture complètes du disque, il peut détecter quelque chose. J'espère que cela t'aides.
la source
Vous pouvez utiliser la suite de tests du fabricant ou quelque chose comme SpinRite pour balayer tout le disque. Ce serait également une bonne idée de regarder les valeurs SMART , à la recherche de secteurs défectueux et d'autres signes de vieillesse / d'échec.
la source
Si vous voulez vraiment tester, utilisez le
badblocks
test d'écriture. Il écrira des modèles de données sur le disque puis les lira pour vérifier. Pendant cela, cela stressera un peu votre disque. À mon avis, s'il fonctionne correctement, vous pouvez faire confiance au disque.Mais je pense que ZFS et une bonne sauvegarde suffisent.
la source