Comment sauvegarder un volume crypté de stockage principal hors site?

0

Avec un disque dur avec un volume de stockage principal chiffré (mais pas le mot de passe de déchiffrement, car le service de sauvegarde ne devrait pas y avoir accès), comment procéder pour le sauvegarder de manière à le transférer vers un fournisseur de stockage en cloud (comme Amazon S3) et pour les sauvegardes incrémentielles dans le futur (parce que vous ne voulez pas appliquer 1 To complet chaque jour lorsque seulement quelques blocs ont été modifiés)?

Thilo
la source

Réponses:

1

Solution proposée:

Vous avez une instance Amazon EC2, avec un magasin de blocs élastiques suffisamment grand pour contenir la totalité de l'image que vous souhaitez sauvegarder:

backup-host.yourdomain.com:
/mnt/EBS/my-desktop-backup/coreimage.dmg
/mnt/EBS/my-laptop-backup/coreimage.dmg

Où:

/dev/ebs-disk-001 -> /mnt/EBS/my-desktop-backup
/dev/ebs-disk-002 -> /mnt/EBS/my-laptop-backup
etc.
etc.

ou

backup-host.yourdomain.com:
/mnt/EBS/my-desktop-backup_coreimage.dmg
/mnt/EBS/my-laptop-backup_coreimage.dmg

Où:

/dev/ebs-disk-001 -> /mnt/EBS

La synchronisation de votre sauvegarde initiale prendrait beaucoup de temps, mais si vous utilisez rsync pour la synchronisation, vous pouvez éventuellement demander à l'image distante de s'adapter aux modifications apportées à votre image locale.

Une fois que cela est rattrapé, vous pouvez initier un instantané EBS du côté d'Amazon pour le volume EBS contenant votre image cryptée.

Rincez et répétez pour chaque période de sauvegarde + instantané que vous souhaitez sauvegarder sur le serveur distant, en tenant compte des éléments / exigences suivants:

  • L'image cryptée doit être démontée.
  • La copie d’image distante doit être synchronisée à 100% avec l’image locale non montée.
  • La capture instantanée doit être effectuée avec le volume EBS distant synchronisé, les mémoires tampons du système de fichiers vidées et aucune modification en attente.

Grâce à cela, vous pourrez effectuer les sauvegardes incrémentielles à l'aide de la technologie cloud d'Amazon.

S3 a des limitations sérieuses, qui ne conviendraient pas à vos besoins, pour ce but particulier.

L’instance EC2, si elle est entièrement prise en charge par EBS, peut être fermée lorsque vous n’effectuez pas de synchronisation à distance. Ainsi, lorsque votre sauvegarde démarre, vous pouvez la faire démarrer via l'API EC2 d'Amazon et obtenir le nom dynamique ou l'adresse IP. Une fois qu'il est confirmé, il peut lancer la sauvegarde rsync. Une fois terminé, il peut arrêter l'image distante et initier une action de capture instantanée de volume Amazon EBS.

Modifier:

rsync effectue des différences de niveau de bloc / bloc pour les fichiers plus volumineux. Vous pouvez spécifier la taille du diff de bloc:

--block-size=SIZE

Vous pouvez également spécifier que le flux de données envoyé au serveur distant soit compressé, ce qui vous permet d'économiser du trafic.

Mises en garde sur S3 vs EBS:

Si la solution que vous utilisez ne prend pas en charge le fractionnement et la transmission parallèle de fichiers volumineux, Amazon S3 limite les données envoyées à moins de 400 Ko / s après une certaine taille.

J'utilise des sauvegardes différentielles rsync sur mes serveurs vers S3 en tant qu'archives compressées. Même avec des tailles de balles d'environ 500 Mo, S3 va étrangler. Pour résoudre ce problème, vous devez diviser le fichier que vous envoyez en plusieurs parties, sinon la sauvegarde sur S3 durera une éternité.

Alors qu’une instance EC2 avec des volumes EBS sera plus rapide et ne nécessitera pas de fractionner les fichiers, ce qui simplifie la sauvegarde et la restauration.

Wing Tang Wong
la source
1
Donc, rsync ne diffs encodé et télécharge que les parties qui ont changé?
Thilo
@Thilo Oui, c'est l'un des principaux avantages de rsync. Et vous voudrez peut-être consulter Arq ou l'une des autres solutions de sauvegarde pour S3.
nohillside
@patrix: Oui, je suis assez intéressé par Arq. Mais je ne pouvais pas trouver de documentation sur la façon dont il gère les gros fichiers qui ne changent qu’un peu à chaque fois.
Thilo
@Thilo C'est dans le deuxième paragraphe sous "Wayback Machine" sur haystacksoftware.com/arq : "Seules les modifications sont téléchargées pour chaque sauvegarde, ce qui réduit l'utilisation du réseau et du stockage". Mais je conviens que les changements peuvent également concerner le niveau de fichier. Peut-être demander leur soutien directement? Et arrêtons la discussion ici maintenant avant qu'un modérateur n'intervienne :-) Envoyez-moi une requête en chat si nécessaire.
nohillside
Comme indiqué dans ma réponse, je recommanderais contre S3, après avoir essayé de l'utiliser comme back-up de sauvegarde, son utilisation présente de nombreux inconvénients, notamment si vous avez l'intention de faire rsync / block diffs. Je vais élaborer dans la réponse. Le logiciel ARQ semble intéressant. Mais je pensais que la question était de savoir comment sauvegarder un système de fichiers chiffré sous sa forme chiffrée et non des fichiers individuels.
Wing Tang Wong