Qu'est-ce qu'un réseau de stockage et quels sont ses avantages par rapport à différentes solutions de stockage?

35

Je propose que ce soit une question canonique sur les réseaux de stockage au niveau de l'entreprise.

Qu'est-ce qu'un réseau de stockage (SAN) et comment fonctionne-t-il?
En quoi est-il différent d'un stockage en réseau (NAS)?
Quels sont les cas d'utilisation comparés au stockage à connexion directe (DAS)?
En quoi est-ce meilleur ou pire?
Pourquoi est-ce si cher?
Dois-je (ou mon entreprise) en utiliser un?

Massimo
la source
@Basil: pensez-vous que la question devrait aussi couvrir les NAS? Ce sont des choses fondamentalement différentes de SAN (et il y a déjà une question qui les compare: serverfault.com/questions/81723/… ). Je voulais que celui-ci traite spécifiquement des réseaux de stockage. Je ne supprime pas votre modification, mais j'apprécierais un retour de la communauté à ce sujet.
Massimo
Le service de fichiers est généralement une fonction de la plupart des périphériques de stockage sur le marché, que la plupart des gens appelleraient un "SAN".
Basil
Je pense que la question que j'ai liée couvre assez bien cela, et les NAS sont conceptuellement beaucoup plus simples (ce sont des serveurs de fichiers). Un SAN est plus complexe, modulaire et coûteux. Élargir la portée de cette question à toutes les formes de stockage la rendrait trop vaste. Ceci est, bien sûr, mon opinion.
Massimo
Ce que je veux dire, c’est que chaque solution de stockage que vous pouvez obtenir maintenant a un service de fichiers intégré. EMC, HDS, IBM, HP, Netapp (évidemment), Dell. Vous ne pouvez pas parler de "SAN" (encore une fois, un abus de langage, puisque c'est ce que vous appelez la couche de connectivité) sans parler du service de fichiers. Pourriez-vous sauter dans la salle de communication?
Basil
1
J'aime la façon dont cela s'est avéré. Je pense qu'il est préférable que cette question se concentre sur ce qu'est un SAN et ne mentionne que NAS en passant. Cette question plus ancienne sur "quelle est la différence entre SAN, NAS, DAS?" pourrait être mis à jour un peu et transformé en un Q & A canonique sur son propre.
Ward - Rétablir Monica

Réponses:

45

Tout d'abord, pour une comparaison (large) du stockage DAS, NAS et SAN, voir ici .


Il existe certaines idées fausses sur le terme " SAN ", qui signifie " réseau de stockage " et, en tant que tel, à proprement parler , fait référence à l’infrastructure de communication connectant des périphériques de stockage (baies de disques, bibliothèques de bandes, etc.) et des utilisateurs de stockage (serveurs ) Cependant, dans la pratique courante, le terme "SAN" désigne deux choses:

  1. Une infrastructure de stockage complète, comprenant tous les matériels et logiciels nécessaires pour fournir un accès partagé aux périphériques de stockage centraux à partir de plusieurs serveurs. Cet usage, même s’il n’est pas strictement correct, est communément accepté et correspond à ce que la plupart des gens font référence à un «SAN». La suite de cette réponse portera sur elle, décrivant ainsi chaque composant d'une infrastructure de stockage au niveau de l'entreprise.
  2. Une seule matrice de stockage (voir plus loin); comme dans "nous avons un SAN de marque X avec 20 To de stockage". Cette utilisation est fondamentalement incorrecte, car elle ne tient même pas compte de la signification réelle de "SAN" et suppose simplement qu'il s'agit d'une forme de périphérique de stockage.

Un SAN peut être composé de matériel très différent, mais peut généralement être décomposé en divers composants:

  • Matrices de stockage : c'est l'endroit où les données sont réellement stockées (et ce qu'on appelle à tort un "SAN" assez souvent). Ils sont composés de:
    • Disques physiques: ils archivent bien sûr les données. Les disques d'entreprise sont utilisés, ce qui signifie qu'ils ont généralement une capacité par disque plus faible, mais des performances et une fiabilité bien supérieures. de plus, ils sont beaucoup plus chers que les disques grand public. Les disques peuvent utiliser une large gamme de connexions et de protocoles ( SATA , SAS , FC , etc.) et différents supports de stockage ( les disques SSD sont de plus en plus répandus), en fonction de la mise en œuvre SAN spécifique.
    • Boîtiers de disques: c'est ici que sont placés les disques. Ils leur fournissent de l'électricité et des connexions de données.
    • Contrôleurs / Processeurs de stockage: ils gèrent les E / S de disque, le RAID et la mise en cache (le terme "contrôleur" ou "processeur" varie selon les fournisseurs de réseau de stockage). Là encore, les contrôleurs d'entreprise sont utilisés. Ils offrent donc des performances et une fiabilité bien meilleures que celles des matériels grand public. Ils peuvent et sont généralement configurés en paire pour la redondance.
    • Pools de stockage : un pool de stockage est un groupe d’espaces de stockage comprenant plusieurs disques (souvent nombreux) dans une configuration RAID. Il s’appelle un "pool" car certaines de ses sections peuvent être allouées, redimensionnées et désallouées à la demande, créant ainsi des LUN.
    • Nombre d'unités logiques (LUN): un LUN est un bloc d'espace tiré d'un pool de stockage, qui est ensuite mis à disposition ("présenté") à un ou plusieurs serveurs. Ceci est considéré par les serveurs comme un volume de stockage et peut être formaté par ceux-ci à l'aide du système de fichiers de leur choix.
  • Bibliothèques de bandes: elles peuvent être connectées à un réseau de stockage et utiliser la même technologie de communication pour la connexion aux serveurs et pour les sauvegardes directes de stockage sur bande.
  • Réseau de communication ( le "SAN" proprement dit ): c’est ce qui permet aux utilisateurs de stockage (serveurs) d’accéder aux périphériques de stockage (baie (s) de stockage, bibliothèques de bandes, etc.); c'est à proprement parler la véritable signification de l'expression "réseau de stockage" et la seule partie d'une infrastructure de stockage qui devrait être définie en tant que telle. Il existe vraiment de nombreuses solutions pour connecter des serveurs à des périphériques de stockage partagés, mais les plus courantes sont les suivantes:
    • Fibre Channel : technologie utilisant la fibre optique pour les connexions haut débit au stockage partagé. Il comprend des adaptateurs de bus hôtes , des câbles à fibres optiques et des commutateurs FC. Il peut atteindre des vitesses de transfert allant de 1 Gbit à 20 Gbit. De plus, les E / S à trajets multiples peuvent être utilisées pour regrouper plusieurs liaisons physiques, permettant une bande passante plus élevée et une tolérance aux pannes plus élevée.
    • iSCSI : implémentation dutransport de protocole SCSI sur IP. Il fonctionne sur dumatériel Ethernet standard, ce qui signifie qu'il peut atteindre des vitesses de transfert de 100 Mbits (généralement pas utilisés pour les réseaux de stockage) à 100 Gbits. Il est également possible d'utiliser des E / S multi-accès (bien que la couche réseau sous-jacente introduit certaines complexités supplémentaires).
    • FCoE (Fibre Channel over Ethernet) : une technologie entre FC complet et iSCSI, qui utilise Ethernet comme couche physique mais FC comme protocole de transport, évitant ainsi le recours à une couche IP au milieu.
    • InfiniBand : une technologie de connectivité très performante, moins utilisée et assez coûteuse, mais pouvant atteindre unebande passante impressionnante .
  • Adaptateurs de bus hôtes (HBA): cartes d'adaptation utilisées par les serveurs pour accéder à la couche de connectivité. il peut s'agir d'adaptateurs dédiés (comme dans les SAN FC) ou de cartes Ethernet standard. Il existe également des adaptateurs HBA iSCSI, dotés d'une connexion Ethernet standard, mais pouvant gérer le protocole iSCSI de manière matérielle, libérant ainsi le serveur d'une charge supplémentaire.

Un réseau de stockage offre de nombreuses fonctionnalités supplémentaires par rapport au stockage connecté directement (ou physiquement partagé):

  • Tolérance aux pannes: la haute disponibilité est intégrée à tout réseau de stockage d'entreprise et est gérée à tous les niveaux, des blocs d'alimentation dans les baies de stockage aux connexions aux serveurs. Les disques sont plus fiables, le RAID résiste aux pannes d'un disque (ou de plusieurs disques), des contrôleurs redondants sont utilisés et les E / S à trajets multiples permettent un accès au stockage ininterrompu, même en cas de défaillance de la liaison.
  • Plus grande capacité de stockage: les réseaux de stockage peuvent contenir de nombreux grands périphériques de stockage, permettant ainsi des espaces de stockage beaucoup plus grands que ce qu'un serveur unique pourrait réaliser.
  • Gestion dynamique du stockage: les volumes de stockage (LUN) peuvent être créés, redimensionnés et détruits à la demande; ils peuvent être déplacés d'un serveur à un autre; L'allocation de stockage supplémentaire à un serveur ne nécessite que certaines configurations, par opposition à l'achat et à l'installation de disques.
  • Performances: un réseau SAN correctement configuré, utilisant des technologies récentes (bien que coûteuses), peut atteindre des performances vraiment impressionnantes. Il est conçu dès le départ pour gérer une charge simultanée importante de plusieurs serveurs.
  • Réplication au niveau du stockage: deux matrices de stockage (ou plus) peuvent être configurées pour la réplication synchrone, ce qui permet la redirection complète des E / S du serveur de l'une à l'autre dans des scénarios d'erreur ou de sinistre.
  • Instantanés au niveau du stockage : la plupart des baies de stockage permettent de prendre des instantanés de volumes uniques et / ou de pools de stockage entiers. Ces instantanés peuvent ensuite être restaurés si nécessaire.
  • Sauvegardes au niveau du stockage: la plupart des réseaux SAN permettent également d'effectuer des sauvegardes directement depuis les baies de stockage vers les bibliothèques de bandes connectées au SAN, en contournant complètement les serveurs qui utilisent réellement les données; diverses techniques sont utilisées pour assurer l'intégrité et la cohérence des données.

Sur la base de tout ce qui précède, les avantages de l’utilisation des réseaux de stockage sont évidents; mais qu'en est-il des coûts d'achat et de la complexité de la gestion?

Les SAN sont du matériel de niveau entreprise (bien qu'il puisse y avoir une analyse de rentabilité pour les petits SAN, même dans les petites et moyennes entreprises); Ils sont bien entendu hautement personnalisables et peuvent donc aller de "quelques To avec iSCSI 1 Gbit et une fiabilité relativement élevée" à "plusieurs centaines de To avec une vitesse, des performances et une fiabilité étonnantes, en passant par une réplication synchrone complète vers un centre de traitement de données de reprise après sinistre"; les coûts varient en conséquence, mais sont généralement plus élevés (comme dans le "coût total", ainsi que dans le "coût par gigaoctet d'espace") par rapport aux autres solutions. Il n'y a pas de norme de tarification, mais il n'est pas rare que même les plus petits SAN aient des étiquettes de prix allant de plusieurs dizaines de milliers de dollars (voire des centaines de milliers de dollars).

La conception et la mise en œuvre d'un réseau de stockage (encore plus pour un réseau haut de gamme) nécessitent des compétences spécifiques. Ce type de travail est généralement effectué par des personnes hautement spécialisées. Les opérations quotidiennes, telles que la gestion des LUN, sont considérablement plus faciles, mais dans de nombreuses entreprises, la gestion du stockage est de toute façon gérée par une personne ou une équipe dédiée.

Indépendamment des considérations ci-dessus, les SAN sont la solution de stockage de choix lorsqu'une grande capacité, fiabilité et performances sont requises.

Massimo
la source
3
Votez ++ pour une réponse aussi détaillée.
Simon Catlin le
3

Avez-vous besoin d'un? Dépend. £ ou $ par To est considérablement plus élevé que le DAS. De plus, les performances de DAS dépassent, je le crains, les performances supérieures des FC / AL et des SAN iSCSI (enfin, du moins lors de mes tests avec des bases de données Oracle et SQL Server). Mais, avec DAS, vous ne bénéficiez pas des avantages du partage de stockage (bon pour le clustering et VMWare).

Un certain nombre de fournisseurs de stockage abandonnent la technologie Fibre Channel pour les connexions de contrôleur hôte à contrôleur de stockage, au profit de iSCSI, qui s'exécute sur Ethernet. C'est encore la vieille saga Token-Ring vs Ethernet. Avec autant de recherches et d’investissements Ethernet dans l’industrie, FC ne peut tout simplement pas suivre le rythme. Un commutateur Ethernet 10 Gbps est beaucoup moins cher qu'un commutateur FC 8 Gbps. De plus, il peut être vLANd ou segmenté de toute autre manière pour fournir des données de stockage et autres que de stockage.

Cependant, les SAN présentent de gros avantages:

  • Instantanés SAN (point de récupération à un moment donné pour un serveur ou une collection de serveurs)
  • Réplication au niveau du bloc sur site et hors site (sans impliquer le serveur hôte, pas besoin de réplication logicielle)
  • Sauvegardes SAN directes - si votre système de sauvegarde peut se connecter à votre réseau SAN et fonctionner avec celui-ci

Si vous envisagez de vous immerger dans l'eau du stockage partagé, découvrez des produits tels que le kit HP P4000.

Simon Catlin
la source