Tableau de bord serveur et réseau

9

Nous avons un centre d'opérations réseau avec une douzaine de grands écrans larges qui nous montrent divers graphiques de performances, des alarmes d'équipement de serveur et de réseau et des pages d'état. De nombreuses pages n'ont évidemment pas été conçues pour être affichées sur un écran statique. Quelqu'un a-t-il une configuration similaire où il a trouvé un outil ou un package particulier qui excelle dans l'affichage des données? Je pense qu'un peu de programmation personnalisée et peut-être quelque chose qui peut faire défiler du texte, afficher des cadrans, des lumières clignotantes et tout ce qui ne produirait pas ce que je recherche, mais je ne sais pas par où commencer. Si quelqu'un a des choses à faire ou à ne pas faire ou à réussir avec des produits particuliers, ce serait d'une grande aide.

MISE À JOUR : Il semble que ce que je recherche est un outil de création de tableau de bord.

Joseph
la source
Quelle est la source de la plupart des données? Je suppose que vous utilisez plusieurs outils de surveillance / alerte différents. Je parierais que la plupart d'entre eux ont des applications complémentaires pour la visualisation.
WerkkreW
Nos principales sources de données sont SPECTRUM et Nagios.
Joseph

Réponses:

3

Les ordinateurs sont bien meilleurs que moi pour analyser les données. Personnellement, je préfère des systèmes comme OpsView qui digèrent les situations et offrent une interface multiforme. Les statistiques de surveillance sont filtrées pour détecter les conditions anormales et des alertes individuelles sont envoyées aux administrateurs responsables du système. Il existe un tableau de bord de santé global qui peut être consulté par le service d'assistance et la direction qui donne une idée de la gravité d'une panne et si quelqu'un qui peut y remédier y travaille encore. Ils l'ont mis en rotation sur grand écran comme quelque chose que vous pouvez voir en un coup d'œil, pas quelque chose que vous regardez du jour au lendemain. Le texte défilant et les lumières clignotantes ne sont pas la façon dont les employés doivent s'interfacer avec vos systèmes de surveillance.

Conrad Albrecht-Buehler a un Google Techtalk ("Making Monitoring Suck Less") qui discute des mérites et des lacunes qu'il voit dans la conception actuelle de l'interface utilisateur du tableau de bord, et propose quelques améliorations. Je ne sais pas s'il a publié du code ou même sa thèse. L'idée générale est simple:

  • Vous définissez la surveillance de situation comme la capture d'un ensemble de signaux concernant un état. Charge, espace disque libre, trafic réseau ou encore des choses de niveau supérieur comme les messages du forum par heure.
  • Ensuite, vous définissez une fonction d'écoute qui mappe le signal d'entrée large de 0 à 1, 0 étant "ignorer" et 1 étant "zomg!". Pour Nagios, il remplace l'état WARNING par un entier WARNING.
  • Enfin, vous définissez un agrégateur pour résumer et hiérarchiser ces signaux AVERTISSEMENT.

En ce qui concerne les outils spécifiques que vous utiliseriez pour écrire votre propre système de surveillance, les scripts Nagios ont une interface décente (c'est probablement là que vous colleriez dans un mappage HEED si vous l'aimez), le stockage des signaux peut être fait avec rrdtool , et vous pouvez générer des graphiques à partir de cela, et il existe une application Django appelée Graphite qui rend les bases de données rrd. Il y a aussi Nagvis :

NagVis est un addon de visualisation pour le système de gestion de réseau bien connu Nagios.

NagVis peut être utilisé pour visualiser les données Nagios, par exemple pour afficher des processus informatiques comme un système de messagerie ou une infrastructure réseau.

jldugger
la source
5

Ce que j'ai fait, c'est que j'en récupère autant que possible dans un navigateur Web. Ensuite, j'utilise Firefox, IE-TAB et Tab mix plus pour afficher les données.

La combinaison d'onglets plus vous permet de mettre à jour et de faire pivoter automatiquement les onglets selon un calendrier.

IE-Tab vous permet d'afficher des fenêtres IE à l'intérieur des onglets afin que TMP puisse effectuer la rotation et la mise à jour automatiques.

Ensuite, vous pouvez afficher tous les écrans sans fil MRTG, CATI, NAGIOS, What'sUp Gold que vous souhaitez et il tourne automatiquement, se met à jour automatiquement et est brillant ... :)

Nous avons un développeur qui construit des applications WPF pour le plaisir, donc quand je veux du brillant, il les construit pour moi.

Thomas Denton
la source
agréable. merci pour l'idée. Je réfléchis à la façon de procéder depuis un certain temps
MikeJ
4

Nous avions trop d'affichages et pas assez d'informations utiles, nous avons donc totalement triché. Nous avons trouvé un économiseur d'écran basé sur LCARS intéressant (qui ressemble aux écrans de Star Trek) et l'avons exécuté sur l'un des écrans inactifs. C'était celui que les patrons regardaient le plus.

Tim Howland
la source
3
Ouaip. Il semble que le plus grand besoin du grand écran soit les patrons qui veulent un showplace. Je me souviens d'un travail où nous avons mis en place des affichages fausses mais beaux. Notre véritable système de statut était la couleur de fond. Vert pour les opérations nominales; jaune si nous avions des problèmes qui feraient en sorte qu'au moins une personne de niveau directeur en prenne note; rouge si cela mettrait en colère 3 administrateurs ou plus. De toute évidence, noir pour une panne de tous les systèmes. Ha-hah.
quux
1

J'ai écrit ma propre visualisation Nagios après avoir découvert qu'aucune des versions faciles à trouver ne peut gérer des centaines d'hôtes avec des dizaines de milliers de vérifications. (Pour publier le code, j'ai besoin de quelques personnes qui veulent l'essayer en dehors de mon environnement pour pouvoir convaincre les patrons)

Même les quelques-uns qui pourraient ne pas casser la configuration manuelle requise que notre générateur de configuration nagios ne pouvait pas être perverti.

Mes visualisations sont utilisées sur OS X et Linux, étrangement le seul navigateur OS X avec un mode plein écran fonctionnel est Opera, ni Safari (et qui inclut le webkit) ni FireFox.

Quelques conseils généraux cependant:

  • Grandes polices, au point d'automatiser les mises en page afin qu'elles s'agrandissent s'il y a moins à afficher
  • Utilisez le tri pour que les plus gros problèmes soient les premiers
  • Utilisez la mise à jour META, pas javascript pour la fiabilité
  • Faites de votre mieux pour minimiser la maintenance nécessaire, mieux vaut être averti d'un système pas encore en production puis découvrir un an en ce qu'il n'a jamais été ajouté aux écrans
  • Le SVG peut être merveilleux, bien qu'il semble s'être corrompu avec le temps (nous utilisons un simple graphique d'un état comme repère visuel supplémentaire)
LapTop006
la source
0

Je ne connais aucun package existant, mais si vous êtes content de coder et que votre NOC est basé sur Windows, vous pourriez être intéressé par les logiciels PowerShellToys que / n a annoncés. Il y a un article sur le blog PowerShell fournissant plus d'informations et des liens vers chaque PowerShellToy. Ma première pensée en entendant parler de ces derniers était qu'ils seraient idéaux pour créer un tableau de bord pour la surveillance des serveurs et ainsi de suite.

alastairs
la source
Bien que les systèmes exécutant les écrans soient basés sur Windows, les données proviennent principalement de systèmes basés sur Linux. Je ne sais pas si cela pourrait aider. L'idée d'un tableau de bord est cependant exactement ce que je recherche.
Joseph
0

Nous utilisons les outils BAC de Mercury (maintenant HP) pour nos tableaux de bord. Je peux prendre des compteurs, des alertes, etc. à partir de TELLEMENT de sources, analyser leurs statistiques et tableau de bord de ces statistiques de différentes manières. Je vous préviens cependant, c'est une solution haut de gamme - très coûteuse.

Chopper3
la source