Je travaille avec un cluster de serveurs Linux derrière la fonctionnalité de mise à l'échelle automatique du cloud Amazon ( documentation ). Il y a des fichiers qui s'accumulent sur chaque serveur, ce sont des fichiers de cache pour l'application. Je recherche un moyen automatisé pour que les serveurs synchronisent ce dossier entre eux.
Rsync
fonctionnerait si quelqu'un avait un moyen intelligent de détecter les pairs.- Il en va de même
Unison
. - Nous avons également envisagé d'utiliser un SaaS tel que Dropbox.
- Gluster semble exagéré, et je ne suis pas sûr de la facilité avec laquelle un nouvel ordinateur rejoint automatiquement le cluster.
Idéalement, ce qui se passerait, c'est quand un nouveau serveur est lancé, il découvre ses pairs et commence la synchronisation du dossier. À partir de ce moment, c'est un dernier horodatage qui gagne la synchronisation P2P.
Quelque chose qui fait ça?
Réponses:
Vous savez aussi bizarre que cela puisse paraître, mais l'utilisation de rtorrent avec DHT activé sur la gamme ec2 privée pourrait fonctionner
Cela vous donnerait
la source
Rsync en amont prend en charge SLP (Service location protocol). Il n'est pas activé dans les sources vanilla rsync, mais vous pouvez trouver le support SLP dans l'archive tar rsync-patches sur la page d'accueil rsync (slp.diff). Par exemple, le package rsync SUSE est construit avec ce correctif; Je ne connais pas les autres distributions.
Je ne suis pas sûr que ce soit ce que vous recherchez et je n'ai aucune expérience avec SLP, cependant.
la source
Peut-être qu'il me manque quelque chose ici, mais y a-t-il une raison pour laquelle vous ne vous contentez pas de configurer un simple répertoire NFS et que toutes les machines le montent? Chaque fois que l'application écrit le nouveau fichier cache, elle devrait simplement remplacer les anciens.
la source
Je suis sûr qu'il existe un outil de gestion Amazon, tel que les outils de ligne de commande , qui vous permet d'écrire un script de démarrage pour que les nœuds se découvrent mutuellement, via des adresses IP privées ou publiques.
Soit dit en passant, rsync et Unison ne sont pas le bon outil, s'ils doivent distribuer les modifications à mettre en cache très fréquemment. Dans ce cas, vous devriez considérer un système de fichiers vraiment distribué.
la source
Peut-être DRBD (périphérique bloc distribué)?
la source