Notre bâtiment est situé à environ. 100 mètres des charges explosives. Cela se produit plusieurs fois par jour et secoue énormément tout le bâtiment. Cela va durer plusieurs jours et les explosions sont supposées devenir plus fortes.
Nos salles de serveurs n'ont rien d'extraordinaire; l'un d'eux a tous les supports sur du béton dur tandis que l'autre a un plancher surélevé (celui qui permet aux câbles de passer dessous).
Quelqu'un a-t-il des astuces, des contre-mesures ou des meilleures pratiques pour nous?
Nous pensons actuellement aux contre-mesures suivantes:
- Rapport quotidien des voyants d'état des salles de serveurs (voyants HD, blocs d'alimentation, etc.).
- Contrôle nocturne du disque sur les serveurs les plus importants
- Commande supplémentaire de disques durs de rechange
Edit: Beaucoup de bonnes réponses ici! Cependant, il faut être accepté. La réponse la plus votée au moment de cette modification obtiendra sa réponse acceptée.
disaster-recovery
server-room
Chris Dale
la source
la source
Réponses:
Si j'étais vous, j'appellerais la compagnie d'assurance de la compagnie pour qu'elle place un accéléromètre.
De cette façon, la compagnie d’assurance saura que ce n’est pas vous qui secouez les disques et elle saura avec certitude que chaque coup retentit, au cas où votre réseau SAN décéderait au même moment.
(Nous l'avons fait.)
la source
Le moment est venu de vérifier que vous avez bien vérifié votre solution de sauvegarde. Tout le matériel de remplacement dans le monde ne vous sauvera pas si vos sauvegardes sont corrompues ou ont été rendues inutilisables.
la source
En plus de toutes les autres suggestions excellentes (en particulier les sauvegardes hors site ), vous devez envisager de protéger votre pièce de la poussière dans la mesure du possible: coupe - froid autour des portes, ruban adhésif autour des fenêtres, etc.
Si vous avez des entrées d’air extérieures, envisagez de changer le filtres lorsque le dynamitage est terminé.
Cela dit, je ne perdrais pas de temps / ressources en analyses de disques nocturnes, ni en argent sur des disques durs de rechange (peut-être en acheter un ou deux pour vos machines les plus critiques, mais souvenez-vous que vous pouvez en faire des disques de nuit, si nécessaire).
Les équipements du serveur sont étonnamment robustes et continueront à fonctionner pendant des années dans des conditions assez pénibles. Les chances sont que vous irez bien.
la source
Montez vos racks de serveur sur les plates - formes ISO-Base . Ceci isolera votre rack de serveur des chocs au sol et permettra à vos systèmes de fonctionner même en cas de mouvement.
Ce n'est pas facile, mais c'est efficace. Surtout dans les zones sismiques.
Pour voir l’ISO-Base en action, regardez cette vidéo illustrant les effets dans un rack de serveur lors d’une simulation sismique . Un rack est monté sur une base ISO, le second ne l’est pas.
la source
Alimentation: en cas de coupure de courant, tous les serveurs, stockage, san (etc.) de votre rack redémarrent-ils? Ou vont-ils apparaître seulement après que vous avez appuyé sur le bouton 'On'?
Ceci pour deux raisons:
Vous pouvez également suggérer à vos utilisateurs d'éteindre et de débrancher les ordinateurs chaque soir.
la source
La plupart des gens parlent de sauvegarde - peu parlent de restauration. Assurez-vous que la restauration à partir d'une sauvegarde est aussi simple que possible. En particulier si le temps est critique.
Si vous avez une réplication de colocalisation, remplacez-les par les maîtres (si le temps le permet), car ceux de votre bâtiment sont beaucoup plus vulnérables. Ils sont également plus susceptibles de tomber pendant les heures de travail (évidemment).
Je conseille également de travailler à domicile.
la source
Jouez du heavy metal pour remplacer le hard rock lorsqu’il explose. Le hard rock est tellement dépassé de toute façon. ;)
Plus sérieusement, il y a peut-être un magasin de matériel de DJ au coin de la rue où vous pourrez vous procurer des matériaux d'absorption des chocs et d'isolation. De nombreux DJ (musique de danse) ont des difficultés similaires lorsqu'ils enregistrent des disques (par exemple, en maintenant une petite aiguille dans un minuscule groove en rotation, un peu comparables à un équipement sensible comme des lecteurs de disque) à un volume extrême alors que la foule autour d'eux saute et frappe. synchronisés sur le sol (le "synchronisé" est important; si vous n'avez jamais entendu parler de l' incident du pont Tacoma Narrows , vous devriez envisager de regarder ce clip ). Rip quelques sacs poubelle ouverts pour fournir une protection supplémentaire contre la poussière.
la source
Je suis surpris que personne n'ait mentionné le processus.
C’est l’occasion idéale de revenir sur ce que vous avez prévu pour la continuité des activités. Quel est le plan si vous devez changer de bureau pendant une journée ou une semaine? Avez-vous des plans à jour sur les dessins et quels systèmes sont prioritaires pour la restauration? La direction est-elle informée que vous avez un plan et au courant de
L'accélération causée par les explosions qui font des ravages dans la salle des serveurs est probablement le moindre de vos soucis. Vos services publics pourraient présenter un risque beaucoup plus élevé, sauf si vous êtes autonome avec une alimentation sur site et une connectivité robuste (en supposant que vous n'êtes pas autonome et que vous soutenez uniquement le personnel local).
Pouvez-vous survivre en cas de défaillance d'une conduite d'eau principale, d'une alimentation électrique ou d'un accès Internet? Avez-vous appelé votre fournisseur d’accès Internet pour savoir s’il était au courant de l’explosion et s’était préparé à rétablir le service via un autre itinéraire si vos services publics étaient interrompus. Vous connaîtrez mieux vos spécificités que nous ne pouvons le deviner, mais vous devriez avoir une liste de tout ce dont vous avez besoin pour fonctionner et indiquer "Que se passe-t-il si cela disparaît de manière inattendue?" pour chaque.
Si vous y réfléchissez bien / sur papier, cela vous aidera à savoir si vous avez des faiblesses qui doivent être corrigées ultérieurement et peut-être à communiquer cela plus tard dans la chaîne si votre organisation n’a rien écrit. Commencez par un résumé analytique de deux pages - juste une info pour que tout le monde sache ce que vous faites.
Oui, disposer de quelques disques durs / pièces de rechange supplémentaires est une bonne chose, mais je serais plus inquiet à propos de choses que je ne peux pas voir ou que je ne contrôle pas directement.
Le véritable avantage de cet exercice de processus est une vérification de la réalité de votre système de surveillance actuel. Une fois que vous avez planifié certains scénarios de base, vous serez mieux préparé à l’imprévu. Avoir un bref résumé de ce que vous prévoyez de survivre et de ce que vous n’allez pas être très utile, peu importe la raison de votre panne, mais également vous aider à améliorer vos activités de surveillance 24 heures sur 24, 7 jours sur 7, plutôt que lorsque la fondation commence à trembler.
la source
J'avais l'habitude de faire fonctionner des ordinateurs sur un site minier en cours de récupération. À mesure que la réclamation se rapprochait du bureau, la salle informatique tremblait presque tous les jours à la fin de la journée.
Mes contre-mesures incluaient le déplacement des paniers au-dessus de certains pieds en caoutchouc dur conçus pour amortir les vibrations. Ils ont été fabriqués par Manson et je viens d’estimer le poids de mon rack et d’acheter les pieds appropriés. Cela semblait réparer tout mouvement dans le rack. La partie la plus difficile était de soulever le rack assez doucement pour faire glisser les pieds dessous.
En outre, comme d'autres l'avaient mentionné, j'avais des sauvegardes que j'avais testées et conservées hors site.
Ces serveurs ont duré 3 ans avec une secousse constante et des plantages sans matériel. Les ordinateurs de bureau dans le bureau ne se sont pas bien comportés, car deux d’entre eux ont eu des pannes catastrophiques de disques durs.
la source
Je n'ai pas encore vu cela mentionné à propos des sauvegardes, mais assurez-vous de les retirer du site! Vous pouvez également effectuer une sauvegarde des configurations de commutateur, pare-feu, etc.
la source
Demandez à la société d'ingénierie de faire le dynamitage. Les chances sont très bonnes, ils ont leur propre matériel sur place ou ont déjà été endommagés par une explosion dans une salle de serveur voisine.
la source
Relisez les chroniques du BOFH . Cela vous donnera des idées pratiques sur la manière de faire cesser les explosions. Tout le reste ne sera qu'une contre-mesure.
En ce qui concerne les contre-mesures, tout le monde a parlé des sauvegardes, je vais donc éviter de répéter ce bon conseil.
Vérifiez quotidiennement vos baies RAID 5 et disposez maintenant de disques de rechange. Toute cette vibration ne peut pas être bénéfique pour les broches, et il est étonnant de constater combien de fois des matrices sauvegardables sont perdues à cause d'une alarme déclenchée par personne et d'une deuxième panne de la broche.
Je suis peut-être optimiste, mais les ingénieurs qui effectuent le dynamitage ne se concentrent généralement pas sur les niveaux de vibration car ils "détruisent les fondations du voisin". Je m'inquiéterais donc beaucoup des pièces mobiles des ordinateurs, autrement dit des disques.
la source
Mettez une protection sous les rayonnages, spécialement celui en béton dur. Ça va (ou est probablement) bien secouer. Si vous ne pouvez pas acheter (spécialement à cause de l’époque), achetez un plancher antisismique, mettez-y un peu de mousse pour réduire le tremblement.
la source