Qu'est-ce qui différencie le stockage cloud (Amazon AWS, Microsoft Azure, google Apps) des réseaux de stockage de centre de données traditionnels (SAN et NAS)?

8

Une certaine confusion à cause de ma question donc pour faire simple:

"Quel type de stockage les grands fournisseurs de cloud utilisent-ils et pourquoi?"

Pour autant que je sache, cependant je ne suis pas en mesure de trouver des différences officielles de mise en réseau de stockage entre les centres de données typiques et les clouds, tous les fournisseurs de cloud utilisent DAS différent des centres de données typiques.

Même le DAS présente de nombreux inconvénients que le SAN ou le NAS, je veux savoir en détail pourquoi les nuages ​​utilisent le DAS à des fins de stockage ou d'application.

Toute ressource ou description sera appréciée pour me faire comprendre.

EDIT: En lisant le document "Défis de mise en réseau et approches résultantes pour la construction de nuages ​​à grande échelle, David Bernstein et Erik Ludvigson (Cisco)", ils mentionnent que,

Curieusement, nous ne voyons pas les nuages ​​des principaux fournisseurs utilisant NAS ou SAN. L'architecture Cloud typique utilise DAS, ce qui n'est pas typique des approches de stockage Datacenter.

Mais ici, il y a un conflit: à mon avis et également indiqué plus loin dans le document, les nuages ​​devraient utiliser SAN ou NAS car le DAS n'est pas approprié lorsqu'une VM se déplace vers un autre serveur mais a encore besoin d'accéder au stockage à partir du serveur d'origine.

Quelles sont les autres raisons pour lesquelles les clouds préfèrent les DAS, NAS ou SAN? quel type de stockage les grands fournisseurs de cloud utilisent-ils et pourquoi?

Berkay
la source
2
Demandez-vous "Quelle est la différence pour moi entre le stockage de mes données dans le cloud et le stockage à l'aide de mon propre SAN ou NAS" ou "Quel type de stockage les grands fournisseurs de cloud utilisent-ils et pourquoi"?
Randy Orrison du

Réponses:

4

Cette réponse a été modifiée après clarification de la question.

Quelles sont les autres raisons pour lesquelles les nuages ​​préfèrent le DAS

Où «DAS» signifie Direct Attached Storage, c'est-à-dire les disques durs SATA ou SAS.

Les fournisseurs de cloud utilisent tous DAS car il offre des améliorations d'ordre de grandeur en termes de prix / performances. Il s'agit d'une mise à l'échelle horizontale .

En bref, les disques durs SATA et les contrôleurs SATA sont des produits bon marché. Ce sont des produits de grande consommation et leur prix est très bas. En construisant un grand cluster de PC bon marché avec des disques SATA bon marché, Google, Amazon et d'autres obtiennent une grande capacité à un prix très bas. Ils ajoutent ensuite leur propre couche logicielle sur le dessus. Leur logiciel effectue la réplication multi-serveurs pour les performances et la fiabilité, la surveillance, le rééquilibrage de la réplication après une panne matérielle, etc.

Vous pouvez jeter un œil à MogileFS comme un représentant plus simple du type de logiciel que Google, Amazon et d'autres utilisent pour le stockage. Bien sûr, il s'agit d'une implémentation différente, mais elle partage bon nombre des mêmes objectifs et solutions de conception que les systèmes à grande échelle. Si vous le souhaitez, voici un point de départ pour en savoir plus sur GoogleFS .

indiqué plus loin dans le document, les nuages ​​doivent utiliser SAN ou NAS car le DAS n'est pas approprié lorsqu'une machine virtuelle se déplace vers un autre serveur

Il y a 2 raisons pour lesquelles les SAN ne sont pas utilisés.

1) Prix. Les SAN sont extrêmement chers à grande échelle. Bien qu'ils puissent être la «meilleure» solution technique, ils ne sont généralement pas utilisés dans des installations à très grande échelle en raison de leur coût.

2) Le théorème du CAP Le théorème du CAP d'Eric Brewer montre qu'à très grande échelle, vous ne pouvez pas maintenir une cohérence élevée tout en conservant une fiabilité, une tolérance aux pannes et des performances acceptables. Les SAN sont une tentative de rendre la cohérence matérielle forte. Cela peut très bien fonctionner pour une installation de serveur 5.000, mais il n'a jamais été prouvé que cela fonctionne pour les 250.000+ serveurs de Google.

Résultat: jusqu'à présent, les fournisseurs de cloud computing ont choisi de pousser la complexité de la maintenance de l'état du serveur au développeur de l'application. Les offres de cloud actuelles ne fournissent pas d'état cohérent pour chaque machine virtuelle. Les serveurs d'applications (machines virtuelles) peuvent se bloquer et leurs données locales peuvent être perdues à tout moment.

Chaque fournisseur a ensuite sa propre implémentation de stockage persistant, que vous êtes censé utiliser pour les données importantes. Les offres d'Amazon sont de bons exemples; MySQL , SimpleDB et Simple Storage Service . Ces offres elles-mêmes reflètent le théorème CAP - l'instance MySQL a une forte cohérence, mais une évolutivité limitée. SimpleDB et S3 évoluent de manière fantastique, mais ne sont finalement cohérents.

Jesper M
la source
Maintenant, la question est claire. Merci pour les liens, je vais les vérifier.
Berkay
J'ai vérifié tous les liens, merci pour les réponses.En général, nous pouvons dire que DAS est préféré pour les fournisseurs de cloud.Mais pour certaines applications, SAN ou NAS peuvent également être utilisés.
Berkay
1

Si vous utilisez DAS, la disponibilité est votre problème

S'ils utilisent DAS alors la disponibilité est leur problème. Et s'ils sont bons, ils utiliseront plusieurs couches d'abstraction pour s'assurer que leur problème ne devienne pas votre problème. Plutôt que d'être accroché à la façon dont ils choisissent de monter leurs disques dans leur centre de données, la question est de savoir si la disponibilité qu'ils garantissent dans leur contrat SLA est adaptée à vos besoins. Oh, et le vrai éléphant dans la pièce, que faites-vous s'ils font faillite (peu probable pour certains fournisseurs peut-être mais vous devriez quand même y penser) et que faites-vous si vous utilisez ces données localement et que votre connexion interweb est indisponible - ce dernier est beaucoup plus probable que leur choix de DAS entraînant directement une panne.

Rob Moir
la source
0

Bien que je ne garde pas la réponse sur DAS vs SAN / NAS ... Il y a beaucoup de choses à considérer lors de la recherche de solutions de stockage.

La quantité de données? Si nous prenons environ Gb, très bien, un NAS avec une sauvegarde pourrait faire le travail. S'il y a des terrabytes de données, le prix augmente très rapidement.

Je pense que le prix est le principal facteur ... si vous avez un SAN, vous avez besoin de:

  • Administrateurs pour le configurer / le gérer.
  • Salle des serveurs (électricité, bande passante, mesures de sécurité autour de cette salle, ...)

Et pourtant, vous n'avez aucune redondance. Si vous avez accès à un centre de données, les choses peuvent être différentes.

Une autre chose à considérer est l'accessibilité. Archivez-vous? Si l'accès n'est pas un problème, archivez quelques fois par jour / semaine / mois vers votre solution de stockage.

Si par contre vous avez des données auxquelles vous devez accéder en permanence, vous trouvez rapidement un goulot d'étranglement de la bande passante, une limitation matérielle (comme les E / S). Mais d'un autre côté, si le volume de transfert avec vos données est élevé, il y a de fortes chances qu'une solution de stockage en ligne vous coûte cher.

Le ROI (retour sur investissement) est ce que tous les fournisseurs de solutions de stockage en ligne annoncent et ils ont souvent raison, en fonction de l'utilisation, bien sûr.

Bonne chance.

Embreau
la source
0

(Opinion seulement et largement généralisante.)

La différence est la couche d'abstraction que vous regardez (généralement).

Les SAN / NAS vous fournissent généralement un volume sur lequel vous pouvez installer un système de fichiers. La valeur de cette approche pour le système final est que vous avez externalisé les détails du matériel physique (par exemple, niveau RAID, emplacement physique, etc.).

En revanche, le stockage dans le cloud vous fournit généralement une interface avec un système de fichiers. L'avantage ici est que vous pouvez souvent obtenir gratuitement des fonctionnalités d'ordre supérieur (par exemple, Dropbox effectue la version automatique de chaque fichier, de manière transparente).

caelyx
la source