J'utilise une configuration assez importante de nagios (environ 4000 services), sans aucune dépendance. Cela se traduit par un énorme gâchis de notifications en cas de problème.
J'essaie de rechercher les meilleures pratiques avec les dépendances Nagios, mais tout ce que je trouve sur le Web est une compréhension de base avec un seul exemple. Ce dont j'ai besoin, ce sont des informations plus approfondies, les meilleures pratiques sur la façon de gérer un tel fichier de configuration.
Exemple: sur un cluster de 100 serveurs avec écoute apache sur chacun, je surveille le nombre de processus apache et le port tcp d'écoute 80. Je veux faire dépendre l'un de l'autre, mais le nom de groupe_hôte dépendant ne fera pas l'affaire car il fait en sorte que tous les services "processus de vérification" dépendent de chacun des services "check_http".
Les questions sont les suivantes: Comment gérez-vous vos dépendances? Utilisez-vous des scripts pour les générer?
Réponses:
D'accord, c'est assez difficile à faire sans script.
Pour chaque commande de vérification de service, j'ai défini (dans une table db) ce dont elle dépend généralement, ce qui m'évite d'avoir à configurer manuellement chaque dépendance de service. Les dépendances d'hôte que je fais à la main, mais faire la découverte d'adresses mac sur des commutateurs via un script est quelque chose qui aiderait à automatiser cela.
exemples:
"check_http_content" dépendrait d'un "check_http" qui dépendrait d'un "check_ping".
"check_cisco_ifstate" dépendrait d'un "check_snmp_ok" qui dépendrait d'un "check_ping"
Si vous créez votre configuration à partir d'une base de données à l'aide d'un script, ce n'est pas trop difficile à implémenter. Sinon, vous voudrez écrire un analyseur pour parcourir votre fichier de configuration et insérer les dépendances en fonction des règles.
Je ne peux pas imaginer avoir une implémentation de nagios importante sans avoir une base de données de configuration à partir de laquelle vous construisez vos configurations, cela vous permet d'ajouter vos propres abstractions lorsque nagios en manque, et rend la vie plus simple à bien d'autres égards.
la source