Quels sont vos plugins Nagios les plus utiles / précieux? [fermé]

33

Nous étendons notre configuration de Nagios 3 et rencontrons fréquemment de nouveaux plug-ins NRPE ou Nagios généraux pour tester notre infrastructure existante. C’est pourtant au compte-gouttes - il serait utile d’obtenir un résumé des plugins que les utilisateurs de Nagios ont le plus à offrir.

Veuillez répertorier un seul plugin par publication, de préférence avec une brève description de pourquoi vous l'aimez et un lien vers le site MonitoringExchange ou le développeur. De cette façon, les gens peuvent voter pour les plugins déjà listés et nous pouvons les voir dans un ordre préférentiel.

Il serait préférable de ne pas répertorier les plugins que d'autres ont déjà mentionnés, pour la même raison. Si vous avez d'autres choses à ajouter concernant un plugin répertorié par une autre personne, veuillez laisser un commentaire sur sa réponse.

Merci!

Mike Pountney
la source

Réponses:

8

En termes de flexibilité, vous ne pouvez pas battre le plugin snmp. C’est derrière presque toutes les vérifications que je fais, et si ce n’est pas le cas, la connexion TCP l’est.

Matt Simmons
la source
À ce stade, Matt (et d’autres :): avez-vous des techniques spéciales que vous utilisez avec? Mon principal atout avec net-snmpd pour le moment est la complexité de la «nouvelle» fonctionnalité d’extension plutôt que d’exec - check_snmpd gère-t-il bien cette situation?
Mike Pountney
7

Nos plugins les plus utiles sont ceux qui testent la fonctionnalité de notre application supérieure. Par exemple, nous avons des tests qui tentent de se connecter au site Web et des tests qui consistent à envoyer un courrier électronique et à cocher la case Vérifier une boîte mail pop3 pour s'assurer de son arrivée. Si l'une de ces choses se casse, nous pouvons utiliser des contrôles de niveau inférieur pour voir ce qui ne va pas. La pop3 est-elle morte? le MTA, le MDA? Le serveur de base de données? le datastore?

David Pashley
la source
Wotcha Dave;) Avez-vous des conseils sur la manière de relier les contrôles de niveau supérieur et inférieur? Par exemple, comment créez-vous une dépendance entre l'envoi d'un courrier électronique et la case à cocher de la case pop3 pour voir s'il est là? Est-il possible de le faire uniquement via Nagios ou utilisez-vous votre propre logique?
Mike Pountney
Êtes-vous vraiment debout à 4h du matin? :) Nagios a des dépendances de service, vous pouvez donc faire en sorte que la vérification de votre courrier électronique dépende des vérifications SMTP, MDA et POP3, mais cela signifie simplement que la vérification de la messagerie électronique ne vous avertit pas si les vérifications de niveau inférieur le font. Cela devient beaucoup plus difficile si vous avez un cluster de serveurs fournissant un service car il n'y a aucun moyen de dire "ne nous alerte pas pour ce service si tous ces services sont morts". Habituellement, nous nous contentons de savoir comment le système s'intègre pour savoir où sont les problèmes.
David Pashley
7

Honnêtement, celui qui fait le plus pour moi est un peu vieux check_disk. Rien ne me fait me sentir si spécial, de cette façon "arrête de manger de la pâte", comme si un serveur qui fonctionnait bien exploserait hier, courait comme un fou, et découvre que c'est parce que j'ai laissé les disques se remplir. Ne jamais avoir à refaire ça dans ma vie vaut beaucoup pour moi.

(Et n'oubliez pas de vérifier les inodes, aussi, les enfants qui regardent à la maison.)

le chaos
la source
7

WebInject est très utile pour surveiller des sites Web si vous voulez aller au-delà de la fonctionnalité check_http. il peut gérer les pages de connexion et effectuer plusieurs étapes en une vérification Nagios.

gareth_bowles
la source
4

Je trouve que check_nfsmount est utile sur beaucoup de mes serveurs.

Edit: Je voterais aussi check_snmp si j'avais le représentant pour le faire. Il est utilisé sur tous mes serveurs, ainsi que la logique sous-jacente à check_hpjd, qui est exécutée sur toutes mes imprimantes HP.

steve.lippert
la source
4

Mon plus utile est celui que j'ai moi-même écrit et qui vérifie les certificats SSL sur nos serveurs Web afin que je puisse garder un œil sur la date d'expiration.

TCampbell
la source
Est-ce posté quelque part?
RainyRat
4
check_http -H www.verisign.com -C 14
wittwerch le
4

PNP (pnp4nagios.org) - génère des graphiques de style RRD pour tout contrôle Nagios qui produit perf. Les données. Très utile, surtout pour essayer de convaincre les développeurs que ce service nouvellement installé est vraiment la cause de tous ces pics de processeur ...

RainyRat
la source
3

check_nt (parler à NSClient ou à quelque chose de similaire sur le sujet) vous permet d'interroger WMI sur un ordinateur Windows. S'il existe un compteur de performance, vous pouvez désormais le contrôler avec Nagios.

RainyRat
la source
Et vous pouvez surveiller tous vos services en cours d'exécution, par exemple vérifier que Exchange ou le serveur SQL sont en cours d'exécution
Simon Foster
2

Il s’agit là d’une fiche éhontée, mais si vous surveillez les machines Windows à l’aide de NRPE, NagiosPluginsNT semble plutôt bien fonctionner. ;-)

Mike
la source
2

Je conviens que check_snmp est un plugin extrêmement précieux; il peut être utilisé à presque toutes les fins et tout est indiqué dans SNMP en général. SNMP est disponible sur des systèmes aussi divers que HP-UX, Tru64 et OpenVMS, sans aucune installation supplémentaire.

Un autre plugin (pas tout à fait) très utile est NagiosGrapher; J'ai mon expérience dans un article qui explique plus, mais aussi pour que d'autres puissent l'utiliser sans les difficultés que j'ai rencontrées.

Un dernier: NSCA. Vous pouvez écrire un script Perl, Ruby ou ksh et alimenter la sortie en NSCA.

Entre les flexibiités de NSCA et SNMP combinées aux rapports de NagiosGrapher, cela devrait très bien élargir votre surveillance.

Mei
la source
2

J'aime check_http pour vérifier que mes sites Web fonctionnent toujours. Je l’ai développé pour vérifier que certains textes y figurent après qu’une fois ma société d’hébergement a décidé de servir des pages vierges et que mes vérifications nagios soient toutes passées, le serveur fonctionnant toujours.

Simon Foster
la source
2

Le plus utile pour moi est celui que j'ai écrit pour mes besoins: nagios-check-web page

Il télécharge une page entière avec js / css / images, avec multi-threads et gzip (économiser beaucoup de bande passante), à ​​la manière de vrais navigateurs.

Vincent
la source
+1 En effet, ce plugin est génial. Utilisation pour l'application. 4 mois maintenant.
Henk
1

Le numéro un est NagiosWSC Il vous permet d'effectuer une surveillance sans agent des hôtes Windows via WMI.

Zypher
la source
sans agent, mais avec un seul point d'échec, beurk.
Toto
1

Celui qui vérifie la latence réelle pour extraire les sites Web et l’analyse pour une balise masquée «status: ok». Il y avait un problème avec notre cache de calmar et un problème de langue qui ne se produisait que toutes les quelques nuits à 3 heures du matin lorsque quelqu'un visitait le site avec un navigateur qui demandait une version de la page internationalisée en turc.

Sérieusement, configurez tous les types de surveillance possibles. Les bogues et erreurs étranges que vous pouvez détecter dans un environnement complexe avec une surveillance efficace sont tout simplement incroyables. Enregistrez également vos données de performance dans une base de données rrd et affichez-les dans Cacti.

Karl Katzke
la source
1

L'un des plugins les plus importants est celui que j'ai écrit moi-même: check_rdiff_backup. Je fais des sauvegardes à l'étranger et Nagios me dit si quelque chose leur arrive.

Si vous recherchez un plugin rdiff-backup, vous en trouverez un sur Google.

zenek
la source
1
En connaissez-vous un pour rsnapshot?
Rory
1

check_curl a été pour moi une aubaine. Nous avons vraiment fait une différence en termes de flexibilité avec les vérifications de sites Web, et nous l'avons également trouvé beaucoup plus facile que Webinject, avec presque toutes les fonctionnalités dont j'avais besoin

sans pain
la source
1

Ce n'était pas strictement un plugin, mais le fait d'utiliser twurl ( https://github.com/marcel/twurl ) comme moyen de déclencher des alertes était une aubaine absolue. Pas besoin d'alertes par SMS et tout simplement satisfaisant.

Détails sur la manière dont cela a été fait: alertes Nagios utilisant Twitter (avec twurl) sans déclencher - excuses pour la promotion éhontée de soi;)

Autres choses...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) a été incroyablement utile en conjonction avec les vérifications standard de la charge de la CPU et du nombre de processus pour déterminer quand / si l'IO est lié et de quelle manière. . Utiliser nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) facilite encore plus les choses.

Jhackett
la source
1

Bien, les simples, simples et par défaut - check_disk, check_load, check_http sont assez parfaits pour la plupart des cas (la plupart du temps nous voulons savoir si les serveurs, les sites Web sont opérationnels, à droite)

et à part check_disk et check_swap, il existe un check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details qui donne la mémoire à l'utilisateur ...

Invent Sekar
la source
0

Centreon définitivement pour les graphiques et toutes les fonctionnalités de Nagios!

Antoine Benkemoun
la source
0

check_multiprocs utilisé avec le texte du lien check_nrpe

Nicolas Marengo
la source
0

C'est une sorte de tricherie, car j'ai beaucoup de développement dessus, et elle vérifie en fait beaucoup de choses différentes en même temps, mais le plugin nagios le plus utile pour moi est Resmon . C'est un agent que vous exécutez sur le serveur lui-même, et Nagios se connecte via http pour effectuer les vérifications. Je suppose que cela ressemble à ce que fait nPRe, mais avec un certain nombre de décisions de conception différentes.

marque
la source
0

J'avais utilisé deux plugins. L'un consistait à fournir un flux XML des alertes et l'autre à envoyer des alertes via Twitter. Les deux étaient utiles (en dehors des plugins réguliers). si vous comptez NRPE comme un plugin, ajoutez-le aussi.

Ram Prasad
la source
0

check_apt est vraiment cool et me rappelle la mise à jour de mes serveurs Debian.

zenek
la source
0

Récemment, j'ai commencé à utiliser le plugin check_multi , en utilisant un NRPE patché / amélioré pour une sortie volumineuse (en raison d'informations HTML et de performances).
C'est presque "un plugin pour les gouverner tous"! ;-)

Henk
la source