J'ai un serveur nagios exécutant Ubuntu avec un processeur Intel à 2,0 GHz, une matrice RAID10 et 400 Mo de RAM. Il surveille un total de 42 services sur 8 hôtes, dont la plupart sont vérifiés en utilisant le plugin check_http même 5 minutes, certains toutes les minutes. Récemment, la charge sur le serveur nagios a dépassé 4, souvent jusqu'à 6. Le serveur exécute également des cactus, collectant des statistiques toutes les minutes pour 6 hôtes.
Je me demande, combien de services un matériel comme celui-ci devrait-il pouvoir gérer? La charge est-elle si élevée parce que je repousse les limites du matériel, ou ce matériel devrait-il être capable de gérer 42 contrôles de service plus des cactus? Si le matériel est inadéquat, dois-je chercher à ajouter plus de RAM, plus de cœurs ou des cœurs plus rapides? Quels contrôles de matériel / service les autres exécutent-ils?
Réponses:
Vous devez déterminer où se trouve votre goulot d'étranglement ...
J'exécute un moniteur nagios qui vérifie plus de 400 hôtes avec des vérifications http, ping et ssh. (ainsi que de nombreux autres contrôles passifs et nscd)
C'est sur un serveur 2xQuadCore avec 4 disques SAS en RAID10.
Je soupçonne que vous rencontrez des conflits d'E / S, car écrire sur beaucoup de disques est très inefficace.
Vous devez déterminer quel processus utilise vos ressources. (cactus, nagios ou autre chose)
Pour la vérification des IO, j'aime iotop. Installez iotop (le package 9.04 fonctionne sur 8.04)
Mais sinon, top devrait également vous aider à trouver votre porc de charge.
Les cactus une fois par minute sont assez agressifs. (Je lance le mien à 5m d'intervalle)
Une approche dont j'ai entendu parler pour les conflits d'écriture rrd consiste à placer vos magasins rrd sur un ramdisk / tmpfs. (assurez-vous de rsync que de temps en temps au stockage persistant)
Bonne chance.
la source
À moins que ce ne soient les cactus qui génèrent la majeure partie de la charge, vous devriez pouvoir exécuter beaucoup plus de contrôles que cela sur votre matériel.
J'exécute nagios sur une machine virtuelle FreeBSD fonctionnant sur Microsoft Virtual Server sur un vieux PC lent (Pentium 3 1 GHz avec un disque PATA lent). La machine virtuelle n'a que 128 Mo de RAM et les performances sont désastreuses.
Cependant, la moyenne de charge est d'environ 0,2, exécutant 158 vérifications sur 42 hôtes.
la source
Sur un ancien PIII avec 256 Mo de RAM, je surveille activement environ 230 services différents. La même machine exécute également MRTG et HylaFAX pour tous nos fax entrants et le fait très confortablement.
la source
Vous devriez pouvoir exécuter une cargaison de chèques nagios avec ce matériel. Nous exécutons une configuration similaire avec environ 70 contrôles et Nagiosgraph - la principale différence est l'ajout de RAM (c'est pas cher, donc je ferais monter la boîte à 2 Go).
Essayez de lancer top ou ps -aux pour voir si le CPU est surchargé, mais j'en doute. Vous pouvez également vérifier les documents de parallélisation nagios pour voir si votre installation tente d'exécuter trop de contrôles à la fois plutôt que de les sérialiser.
la source