J'ai une configuration de serveur nagios pour surveiller ~ 30 serveurs Windows. Je veux ajouter quelques graphiques de tendances. J'ai lu que les plugins graphiques nagios sont simples et que beaucoup de gens utilisent des outils de cartographie / tendance séparés et autonomes.
Quelles sont les restrictions des plugins graphiques nagios par rapport aux produits autonomes tels que ganglia / munin / cacti?
Je suis intéressé par les fonctionnalités et avantages spécifiques que les packages autonomes offrent et les plugins graphiques nagios ne le font pas.
Réponses:
étant donné que vous avez déjà une installation nagios, pensez à nagiosgraph ou pnp4nagios.
nagiosgraph et pnp4nagios font un très bon travail de traçage des données de performances de nagios. nagiosgraph a une approche de configuration basée sur les paramètres, pnp4nagios a une approche basée sur un modèle.
le découpage et la découpe des données sont assez importants, à mon humble avis. par exemple, vous pouvez afficher tous les services sur un seul hôte, ou afficher tous les hôtes avec un service spécifique, ou afficher des collections arbitraires de graphiques pour des hôtes et des services arbitraires.
l'installation n'est pas anodine, mais pas difficile. cela dépend beaucoup de la façon dont vous souhaitez personnaliser les choses. par exemple, nagiosgraph est 'install.pl' ou 'rpm -i nagiosgraph.rpm' ou 'dpkg -i nagiosgraph.deb'. pnp4nagios est './configure; faire; faire installer '.
n2rrd peut également faire certaines de ces choses, mais il n'est pas aussi poli et nécessite plus de travail à configurer.
rrdtool a un stockage de données excentrique et tout système aura des problèmes d'échantillonnage. rrdtool effectue un lissage des données par défaut, mais vous pouvez capturer (et représenter graphiquement) les maximums et / ou minimums en plus des moyennes si nécessaire.
chaque approche basée sur rrdtool souffre de l'obsolescence des données / graphiques car le schéma de chaque fichier rrd est statique et la plupart des systèmes utilisent le nom de fichier rrd pour identifier les données. les données ne sont généralement jamais perdues lorsqu'un nom d'hôte ou un nom de service change; les fichiers rrd existent toujours sur le disque. mais certaines interfaces utilisateur fournissent des moyens de voir les fichiers rrd «périmés», d'autres nécessitent un entretien manuel via la ligne de commande. sur de nombreuses installations, cela n'est un problème que lors de la configuration initiale du système, mais dans des environnements dynamiques (par exemple, la surveillance de machines virtuelles dont la durée de vie n'est que de quelques mois), cela peut devenir fastidieux.
une dernière note. la tendance est en réalité composée de deux parties: la collecte et l'affichage des données. si vous optez pour un système graphique autonome plutôt que d'étendre votre installation nagios existante, vous devrez peut-être installer des composants supplémentaires sur vos machines Windows afin de collecter les données.
la source
Je suis d'accord avec Lynxman. NAGIOS est destiné aux données qualitatives immédiates (X est-il OK ou non?); munin est destiné aux données quantitatives historiques (quel est le niveau de remplissage de X actuellement, et quel est le niveau de cette année?). Toutes mes installations NAGIOS, dont certaines surveillent plusieurs centaines de services, sont reliées à des systèmes munin pour faire le suivi quantitatif.
Notez également que munin a des crochets spécifiques pour l'alimentation des données dans NAGIOS. Il comprend le concept des seuils AVERTISSEMENT et CRITIQUE, et là où une notification (et une vue sur le «grand tableau» NAGIOS) est requise, il est très très facile d'avoir une seule variable munin informant l'état d'un service NAGIOS unique.
Le flux de travail habituel est que personne ne regarde les graphiques munin jusqu'à ce que NAGIOS alerte qu'un seuil a été franchi, mais ensuite les graphiques munin deviennent inestimables pour savoir si quelque chose s'est lentement accéléré au fil du temps, ou s'il s'agit d'une sortie de l'ordinaire. -augmentation bleue, ou nous avons un cycle hebdomadaire de haut en bas qui augmente lentement en amplitude, ou quoi.
Comme le dit lynxman, la méthode UNIX est "une tâche, un outil". Faire une chaîne d'outils de munin et NAGIOS fonctionne très bien pour moi pour fournir un suivi quantitatif et qualitatif ainsi que des notifications. Il a également l'avantage distinct de garder les interfaces propres: lorsque vous regardez NAGIOS, vous voyez une vue simple de la façon dont les choses fonctionnent actuellement , sans données historiques encombrant la vue; lorsque vous regardez munin, vous voyez des informations historiques pertinentes au problème prêtes pour votre analyse, sans les erreurs "l'hôte est en panne" ou "sshd ne me parlera pas" qui encombrent la vue.
la source
Les plugins graphiques Nagios comme vous le dites sont très restreints, ils offrent une interface rrdtool très basique et la conception de l'interface utilisateur est un peu contre-intuitive, c'est essentiellement un hack sur nagios, a essayé de l'utiliser juste pour le plaisir mais il s'est cassé plusieurs fois sans avertissement.
Opter pour un produit autonome (en particulier munin ou ganglia) vous offre une large gamme de services que les nagios ne peuvent pas accomplir, comme le mantra unix, il vaut mieux être bon dans une seule chose que d'essayer d'être bon dans plusieurs, nagios est incroyable pour la surveillance et les munins / ganglions / cactus sont incroyables pour la représentation graphique.
la source
Chez Stack Overflow, nous utilisons n2rrd qui est un plugin Nagios pour représenter graphiquement les données de performance. Dans une certaine mesure, je serais d'accord avec Lynxman pour dire qu'il a une grande sensation de hackish.
Toutefois:
Les graphiques rrd sont stockés en fonction des noms de serveur, donc si vous changez le nom de quelque chose, vous perdez en quelque sorte les données ... Vous pouvez toujours renommer les fichiers en les liant symboliquement et vous ne perdrez pas les données.
J'ai quelques exemples de ces graphiques dans mon récent article Quelques conseils pour un meilleur blog sur les défauts du serveur RRD Graphs . De plus, la page n2rrd inclut à la fois la démonstration de cactus et rrd2graph.
Je pense que l'essentiel est que suivre la route de Nagios pourrait manquer d'une ou deux fonctionnalités, mais est assez complet si cela ne vous dérange pas de vous salir les détails de l'écriture des modèles rrd vous-même *. Cela va probablement vous prendre plus de temps mais cela encouragera à développer plus d'expertise en rrd.
la source
Je demande des données précises et l'affichage des données de rrd n'est pas précis - c'est normalisé! Pour la plupart des utilisateurs, c'est très bien car ils n'utilisent pas de données très précises pour commencer. Ils utilisent des données dont les taux d'échantillonnage sont souvent d'une minute ou plus et qui ne vous donneront pas une description très précise de ce qui se passe. Cela signifie également que si vous avez un pic dans vos données quelque part, vous ne le verrez peut-être jamais.
Considérez ceci - disons que votre réseau Go fonctionne à environ 10 Mo / sec et que tout à coup il y a un pic de 100 Mo / sec pendant quelques minutes. Notez également que si ce n'était qu'un pic de 30 secondes, vous ne le verriez peut-être même pas à des taux d'échantillonnage de quelques minutes. Si vous regardez les données de la journée, cette «pointe» ne peut apparaître que sous 15 Mo / s, bien que la valeur réelle dépende également d'un certain nombre d'autres facteurs. Il est également très probable que vous supposiez que votre réseau est content quand il ne l'est pas!
Ce qui est encore plus frustrant pour moi, ce sont les données normalisées à la largeur physique du graphique et à la plage de l'axe des x. Qu'est-ce que cela signifie, c'est que le pic que j'ai mentionné que vous n'avez pas vu? Si vous zoomez, il apparaît comme par magie! Je m'en tiendrai à gnuplot - les graphiques ne sont peut-être pas aussi jolis mais ils sont solides et gnuplot ne modifie jamais les données avant de les afficher.
-marque
la source
Je trouve que l'utilisation de pnp4nagios fonctionne très bien pour la représentation graphique. Il prend également en charge le zoom. Ce n'est pas le plus facile à implémenter, mais rien avec nagios ne l'est jamais.
la source