Solutions graphiques Nagios vs Munin / Cacti / Ganglia

9

J'ai une configuration de serveur nagios pour surveiller ~ 30 serveurs Windows. Je veux ajouter quelques graphiques de tendances. J'ai lu que les plugins graphiques nagios sont simples et que beaucoup de gens utilisent des outils de cartographie / tendance séparés et autonomes.

Quelles sont les restrictions des plugins graphiques nagios par rapport aux produits autonomes tels que ganglia / munin / cacti?

Je suis intéressé par les fonctionnalités et avantages spécifiques que les packages autonomes offrent et les plugins graphiques nagios ne le font pas.

sumek
la source
Vous devriez également considérer Zabbix ... serverfault.com/q/109595/2039
sebthebert
Essayez l'édition communautaire opsview, basée sur nagios. Vous pouvez installer dans différentes versions de Linux ou télécharger VM. opsview.com/downloads/download-opsview-community
Matias Dominoni
Pour mémoire: j'ai essayé nagiosgraph puis collé avec. Je suis assez content de ce qu'il offre
sumek

Réponses:

7

étant donné que vous avez déjà une installation nagios, pensez à nagiosgraph ou pnp4nagios.

nagiosgraph et pnp4nagios font un très bon travail de traçage des données de performances de nagios. nagiosgraph a une approche de configuration basée sur les paramètres, pnp4nagios a une approche basée sur un modèle.

  • les deux détectent automatiquement les nouveaux hôtes / services chaque fois que la configuration de nagios change
  • les deux font un zoom graphique
  • les deux fournissent des graphiques lorsque vous passez la souris sur des hôtes / services spécifiques
  • les deux offrent de nombreuses façons de découper et de découper vos données
  • détecter et représenter graphiquement les niveaux critiques et d'avertissement que vous avez déjà définis dans les nagios
  • les deux peuvent être intégrés directement dans le cadre nagios pour une navigation transparente et épurée de l'état actuel à l'historique et inversement

le découpage et la découpe des données sont assez importants, à mon humble avis. par exemple, vous pouvez afficher tous les services sur un seul hôte, ou afficher tous les hôtes avec un service spécifique, ou afficher des collections arbitraires de graphiques pour des hôtes et des services arbitraires.

l'installation n'est pas anodine, mais pas difficile. cela dépend beaucoup de la façon dont vous souhaitez personnaliser les choses. par exemple, nagiosgraph est 'install.pl' ou 'rpm -i nagiosgraph.rpm' ou 'dpkg -i nagiosgraph.deb'. pnp4nagios est './configure; faire; faire installer '.

n2rrd peut également faire certaines de ces choses, mais il n'est pas aussi poli et nécessite plus de travail à configurer.

rrdtool a un stockage de données excentrique et tout système aura des problèmes d'échantillonnage. rrdtool effectue un lissage des données par défaut, mais vous pouvez capturer (et représenter graphiquement) les maximums et / ou minimums en plus des moyennes si nécessaire.

chaque approche basée sur rrdtool souffre de l'obsolescence des données / graphiques car le schéma de chaque fichier rrd est statique et la plupart des systèmes utilisent le nom de fichier rrd pour identifier les données. les données ne sont généralement jamais perdues lorsqu'un nom d'hôte ou un nom de service change; les fichiers rrd existent toujours sur le disque. mais certaines interfaces utilisateur fournissent des moyens de voir les fichiers rrd «périmés», d'autres nécessitent un entretien manuel via la ligne de commande. sur de nombreuses installations, cela n'est un problème que lors de la configuration initiale du système, mais dans des environnements dynamiques (par exemple, la surveillance de machines virtuelles dont la durée de vie n'est que de quelques mois), cela peut devenir fastidieux.

une dernière note. la tendance est en réalité composée de deux parties: la collecte et l'affichage des données. si vous optez pour un système graphique autonome plutôt que d'étendre votre installation nagios existante, vous devrez peut-être installer des composants supplémentaires sur vos machines Windows afin de collecter les données.

Matthew Wall
la source
13

Je suis d'accord avec Lynxman. NAGIOS est destiné aux données qualitatives immédiates (X est-il OK ou non?); munin est destiné aux données quantitatives historiques (quel est le niveau de remplissage de X actuellement, et quel est le niveau de cette année?). Toutes mes installations NAGIOS, dont certaines surveillent plusieurs centaines de services, sont reliées à des systèmes munin pour faire le suivi quantitatif.

Notez également que munin a des crochets spécifiques pour l'alimentation des données dans NAGIOS. Il comprend le concept des seuils AVERTISSEMENT et CRITIQUE, et là où une notification (et une vue sur le «grand tableau» NAGIOS) est requise, il est très très facile d'avoir une seule variable munin informant l'état d'un service NAGIOS unique.

Le flux de travail habituel est que personne ne regarde les graphiques munin jusqu'à ce que NAGIOS alerte qu'un seuil a été franchi, mais ensuite les graphiques munin deviennent inestimables pour savoir si quelque chose s'est lentement accéléré au fil du temps, ou s'il s'agit d'une sortie de l'ordinaire. -augmentation bleue, ou nous avons un cycle hebdomadaire de haut en bas qui augmente lentement en amplitude, ou quoi.

Comme le dit lynxman, la méthode UNIX est "une tâche, un outil". Faire une chaîne d'outils de munin et NAGIOS fonctionne très bien pour moi pour fournir un suivi quantitatif et qualitatif ainsi que des notifications. Il a également l'avantage distinct de garder les interfaces propres: lorsque vous regardez NAGIOS, vous voyez une vue simple de la façon dont les choses fonctionnent actuellement , sans données historiques encombrant la vue; lorsque vous regardez munin, vous voyez des informations historiques pertinentes au problème prêtes pour votre analyse, sans les erreurs "l'hôte est en panne" ou "sshd ne me parlera pas" qui encombrent la vue.

Chapelier Fou
la source
3

Les plugins graphiques Nagios comme vous le dites sont très restreints, ils offrent une interface rrdtool très basique et la conception de l'interface utilisateur est un peu contre-intuitive, c'est essentiellement un hack sur nagios, a essayé de l'utiliser juste pour le plaisir mais il s'est cassé plusieurs fois sans avertissement.

Opter pour un produit autonome (en particulier munin ou ganglia) vous offre une large gamme de services que les nagios ne peuvent pas accomplir, comme le mantra unix, il vaut mieux être bon dans une seule chose que d'essayer d'être bon dans plusieurs, nagios est incroyable pour la surveillance et les munins / ganglions / cactus sont incroyables pour la représentation graphique.

lynxman
la source
Alors, qu'est-ce à l'intérieur d' une grande gamme de services que les nagios ne peuvent pas accomplir ? C'est ce qui m'intéresse.
sumek
Avec nagios, il est très facile de perdre vos données de graphique, il est également très facile pour le plugin d'arrêter de représenter les données à tout moment, cela ne vous donne aucune possibilité de zoomer sur une heure spécifique (ce que font tous les autres), il ne vous donne pas la possibilité de faire des graphiques agrégatifs compliqués, et c'est juste pour les débutants :)
lynxman
Que voulez-vous dire par perdre facilement vos données graphiques ? Un rapide google montre que les 5 solutions mentionnées (ganglions, munin, cactus, pnpgraph, nagiosgraph) utilisent rrdtool pour stocker les données du graphique.
sumek
Oui sumek, ce à quoi je fais référence, c'est que l'outil graphique sur nagios est à nouveau un hack, et chaque fois qu'il y a un décalage entre le nom du fichier rrd et les informations du graphique, il se cassera, si vous voulez l'essayer, souffrez de la douleur comme je a fait et ensuite passer à une vraie solution comme munin :)
lynxman
2

Chez Stack Overflow, nous utilisons n2rrd qui est un plugin Nagios pour représenter graphiquement les données de performance. Dans une certaine mesure, je serais d'accord avec Lynxman pour dire qu'il a une grande sensation de hackish.

Toutefois:

  • Avec n2rrd, vous pouvez demander à Cacti de faire le graphique en fonction des données au lieu du rrd2graph.cgi fourni avec n2rrd
  • n2rrd avec le rrd2graph.cgi prend en charge le zoom
  • En ce qui concerne les graphiques agrégés compliqués - vous manipulez essentiellement les graphiques rrd à la main et pouvez faire tout ce que vous voulez avec eux.

Les graphiques rrd sont stockés en fonction des noms de serveur, donc si vous changez le nom de quelque chose, vous perdez en quelque sorte les données ... Vous pouvez toujours renommer les fichiers en les liant symboliquement et vous ne perdrez pas les données.

J'ai quelques exemples de ces graphiques dans mon récent article Quelques conseils pour un meilleur blog sur les défauts du serveur RRD Graphs . De plus, la page n2rrd inclut à la fois la démonstration de cactus et rrd2graph.

Je pense que l'essentiel est que suivre la route de Nagios pourrait manquer d'une ou deux fonctionnalités, mais est assez complet si cela ne vous dérange pas de vous salir les détails de l'écriture des modèles rrd vous-même *. Cela va probablement vous prendre plus de temps mais cela encouragera à développer plus d'expertise en rrd.

Kyle Brandt
la source
1
* [erreur de référence non référencée]: qu'alliez-vous y ajouter, kyle; les esprits curieux doivent savoir!
MadHatter
0

Je demande des données précises et l'affichage des données de rrd n'est pas précis - c'est normalisé! Pour la plupart des utilisateurs, c'est très bien car ils n'utilisent pas de données très précises pour commencer. Ils utilisent des données dont les taux d'échantillonnage sont souvent d'une minute ou plus et qui ne vous donneront pas une description très précise de ce qui se passe. Cela signifie également que si vous avez un pic dans vos données quelque part, vous ne le verrez peut-être jamais.

Considérez ceci - disons que votre réseau Go fonctionne à environ 10 Mo / sec et que tout à coup il y a un pic de 100 Mo / sec pendant quelques minutes. Notez également que si ce n'était qu'un pic de 30 secondes, vous ne le verriez peut-être même pas à des taux d'échantillonnage de quelques minutes. Si vous regardez les données de la journée, cette «pointe» ne peut apparaître que sous 15 Mo / s, bien que la valeur réelle dépende également d'un certain nombre d'autres facteurs. Il est également très probable que vous supposiez que votre réseau est content quand il ne l'est pas!

Ce qui est encore plus frustrant pour moi, ce sont les données normalisées à la largeur physique du graphique et à la plage de l'axe des x. Qu'est-ce que cela signifie, c'est que le pic que j'ai mentionné que vous n'avez pas vu? Si vous zoomez, il apparaît comme par magie! Je m'en tiendrai à gnuplot - les graphiques ne sont peut-être pas aussi jolis mais ils sont solides et gnuplot ne modifie jamais les données avant de les afficher.

-marque

Mark Seger
la source
0

Je trouve que l'utilisation de pnp4nagios fonctionne très bien pour la représentation graphique. Il prend également en charge le zoom. Ce n'est pas le plus facile à implémenter, mais rien avec nagios ne l'est jamais.

Matthew Thode
la source