Dois-je exécuter une vérification sur les sauvegardes sur bande LTO même si les lecteurs eux-mêmes effectuent une vérification au moment de l'écriture?

8

Nous avons un lecteur de bande LTO-3 dans une bibliothèque multimédia Dell que nous utilisons pour nos sauvegardes sur bande. L' article sur LTO sur Wikipedia déclare que:

Le LTO utilise une technologie de vérification automatique après écriture pour vérifier immédiatement les données lors de leur écriture, mais certains systèmes de sauvegarde effectuent explicitement une opération de lecture de bande complètement distincte pour vérifier que la bande a été correctement écrite. Cette opération de vérification distincte double le nombre de passes de bout en bout pour chaque sauvegarde planifiée et réduit de moitié la durée de vie de la bande.

Ce que je voudrais savoir, est-ce que j'ai besoin de mon logiciel de sauvegarde (Backup Exec dans ce cas) pour effectuer une vérification sur ces bandes ou la technologie de vérification après écriture inhérente aux lecteurs LTO est-elle suffisante?

Je serais également curieux de savoir si Backup Exec comprend suffisamment la technologie de vérification après écriture pour m'avertir si cette technologie ne pouvait pas très fortifier les données ou l'ignorerait-elle simplement, la rendant de toute façon inutile car même si le lecteur détecte un problème, je ne le ferais jamais le savoir.

Chris Magnuson
la source

Réponses:

10

Grande question!

Alors que je dirais que oui, vous devriez les tester, je dirais que tester les bandes / lecteurs en eux-mêmes est important, ce qui est beaucoup plus vital, c'est tester le processus de restauration de bout en bout .

Je ne peux pas recommander suffisamment de restaurations complètes du système et de tests de service, c'est le seul moyen de savoir avec certitude que l'ensemble du système fait ce pour quoi vous l'avez acheté. Vous n'avez pas besoin de chercher bien loin sur ce site pour voir des gens qui ont du mal à restaurer leur service même s'ils pensaient avoir parcouru toutes les étapes individuellement.

J'espère que cela t'aides.

Chopper3
la source
1
+1 pour la restauration. C'est à ce point que j'interviens avec des "machines virtuelles!" - la restauration sur une machine virtuelle peut être un bon indicateur non perturbateur de l'utilité de votre sauvegarde
Sirex
1
Ce que vous dites est certainement une bonne idée et nous devrions commencer à le faire, mais je ne sais toujours pas si la technologie de vérification à l'écriture des lecteurs LTO 3 entraînera l'échec de ma sauvegarde si, pour une raison quelconque, les données ne peuvent pas être vérifiées comme le ferait se produire si mon logiciel de sauvegarde a exécuté une vérification sur les données. J'aime l'idée de faire quelque chose de plus, mais j'ai encore besoin de savoir si je fais actuellement quelque chose de redondant qui n'est pas nécessaire. Merci
Chris Magnuson
1
Assurez-vous également que vous effectuez une restauration à l'aide d'un lecteur de bande différent de celui utilisé pour la sauvegarde, car certaines bandes ne peuvent être lues que sur le lecteur qui les a créées (ou du moins, cela était possible dans le passé).
James
@ChrisMagnuson Avez-vous déjà découvert ce qui se passe si le lecteur détecte une erreur en utilisant son propre schéma de vérification après écriture?
alx9r
1
@ alx9r J'ai bien peur que non. Il semble que personne ne le sache avec certitude et je ne sais pas comment vous pouvez intentionnellement gâcher les données immédiatement après qu'elles ont été écrites par la tête de bande, mais avant qu'elles ne soient lues par quelque mécanisme que ce soit, la vérification après écriture afin que vous puissiez voir comment votre logiciel de sauvegarde réagit à la détection d'une erreur.
Chris Magnuson
1

Tout d'abord, cette vérification automatique ne remplace pas la vérification de bout en bout. J'ai vu des disques livrés avec un bogue de micrologiciel qui rendait la lecture de restauration moins fiable que la lecture de vérification.

Le résultat de cela était que vous pouviez écrire les bandes sans qu'aucune erreur ne soit signalée, mais en essayant de restaurer, vous verriez les lectures obtenir des erreurs ou chuter de vitesse de plusieurs ordres de grandeur.

La plupart des clients n'ont jamais remarqué ce bug de firmware. Selon le fournisseur, car les clients n'ont pas effectué de restauration de test. Ce bug particulier a été corrigé. Mais je suis sûr que nous n'avons pas vu le dernier bug du firmware, et certains bugs du firmware ne seront découverts que si vous testez réellement de vraies lectures.

Ce qui se passe lorsque la vérification échoue, c'est que le micrologiciel écrit automatiquement une deuxième copie (et lors de la restauration transparente du micrologiciel sur l'hôte, il ne renvoie qu'une seule des deux copies). Cela signifie que la capacité disponible varie en fonction de l'intégrité du lecteur et de la qualité du support.

Si trop de tentatives d'écriture échouent lors de la lecture de vérification, une erreur est rapportée au niveau SCSI. On pourrait penser qu'une erreur signalée de cette manière est difficile à manquer au niveau de la couche logicielle, mais les bogues dans les chemins de code qui ne sont déclenchés que par du matériel fragile sont notoirement difficiles à tester.

kasperd
la source