Pour une liste plus complète des outils de surveillance et de leurs fonctionnalités, consultez cette page Wikipedia .
Comme le dit la question, quels sont les outils les plus couramment utilisés pour cette tâche et quels sont leurs points forts et leurs points faibles?
monitoring
voretaq7
la source
la source
Réponses:
J'ai utilisé Nagios avec succès dans le passé. Il est très extensible (plus de 200 add-ons), relativement facile à utiliser et plein de rapports. Un négatif serait la configuration initiale.
la source
Cacti est une très bonne interface Web pour RRDTool , fournissant des graphiques et des statistiques très pratiques. RRDTool est la partie qui rassemble les données de plusieurs systèmes et surveille un large éventail de données techniques.
Nous utilisons cette solution cacti / RRDTool pour surveiller les systèmes Unix et Windows. Nous obtenons de nombreuses mesures utiles, notamment la charge, l'utilisation du processeur / RAM, de l'espace HD, des utilisateurs connectés, du trafic réseau, des processus en cours, etc.
Vous trouverez plus d'informations sur les cactus dans la rubrique Qu'est-ce que les cactus? page.
la source
Personnellement, j'adore Munin, qui est très facile à installer et à écrire des plugins car son architecture est très simple. Il y a déjà pas mal de plugins pour tous les objectifs que vous pouvez imaginer, vous n'aurez donc probablement même pas besoin d'écrire des plugins en premier lieu.
Il fournit également de beaux graphiques et la possibilité de configurer des alertes (très basiques).
la source
Zabbix . Il est open-source et relativement simple à configurer et à personnaliser. De nombreux scripts de surveillance personnalisés alimentent le serveur zabbix, mais celui-ci s’occupe de la centralisation, de l’affichage approprié, des notifications (courrier électronique, messagerie instantanée, SMS, Twitter, etc.), etc.
la source
Je fais les déploiements de Spiceworks à notre entreprise et nous constatons qu'il est un outil non seulement pour surveiller les serveurs mais tout le reste sur le réseau.
Il effectue des opérations telles que l'inventaire automatique et la surveillance personnalisée pour vous envoyer des courriels en cas de problème (par exemple, le nombre d'imprimantes est réduit à 10% ou le disque dur de ce serveur en contient 20%).
Son inconvénient serait probablement la densité d’informations par ordinateur. Ne vous y trompez pas: il a BEAUCOUP de données par machine, mais pour des serveurs tels que les serveurs sur lesquels vous pourriez avoir besoin de beaucoup de statistiques, vous pourriez avoir besoin d’utiliser un autre outil.
EDIT: oh ai-je mentionné que son modèle commercial est basé sur sa gratuité pour toujours.
la source
Smokeping non seulement vérifie la disponibilité de divers serveurs et services, mais conserve également une trace de leur latence tout en offrant des graphiques faciles à utiliser, agréables à regarder et rapides à afficher .
Une large gamme de plug-ins de mesure de latence est disponible prête à l'emploi. Si vous connaissez Perl, il est facile de créer les vôtres pour tous vos besoins exotiques.
Les grandes installations bénéficieront du système maître / esclave pour les mesures distribuées.
Un système d'alerte hautement configurable vous aidera à remarquer les problèmes avant qu'ils n'affectent les utilisateurs ou ne deviennent des pannes majeures.
Smokeping est un logiciel gratuit et OpenSource écrit en Perl par Tobi Oetiker, créateur de MRTG et de RRDtool.
la source
OpenNMS est utilisé là où je travaille pour surveiller plus d’un millier de machines Linux. Nous surveillons le matériel de chaque machine et les applications qui y sont exécutées.
la source
Zenoss Core est d’une certaine utilité. Nous l’utilisons (depuis environ un an) pour une surveillance légère des serveurs, des commutateurs de réseau et des onduleurs.
la source
Nagios est génial car c'est gratuit et il y a beaucoup de plugins pour cela. Cependant, l'interface utilisateur et la configuration sont très difficiles.
C’est tout le contraire chez Microsoft System Center Operations Manager (SCOM) qui n’est pas gratuit, a moins de plugins, mais la configuration et la configuration sont brillantes et faciles.
Je dois admettre que si j'étais dans une société principalement Microsoft, si j'avais des exigences de confiance très élevées (je ne pouvais pas me permettre de surveiller) ou si je devais envisager de faire travailler les développeurs, SCOM serait ma recommandation par rapport à Nagios.
la source
J'ai utilisé:
la source
Nous utilisons AlertFox depuis quelques semaines et nous en sommes très heureux. Il vérifie non seulement notre disponibilité et nos performances, mais surveille également le panier, les identifiants de l'utilisateur et d'autres parties critiques du site Web via des scripts de transaction (basés sur iMacros).
Pour notre surveillance interne (espace disque, etc.), nous utilisons Nagios .
la source
PRTG Network Monitor - ne peut pas en dire assez sur ce sujet. Un front-end Web impressionnant, particulièrement adapté à la surveillance des routeurs (bande passante, etc.) et à d'autres périphériques via SNMP et à la mesure de la disponibilité des SLA, etc.
www.paessler.com
la source
En tant que personne sous Windows, MOM. Nous envisageons de mettre à niveau vers SCOM (Systems Center Operations Manager), mais nous n’aurons pas besoin de le faire avant de déployer Windows 2008.
la source
Je fais partie d'un projet de mise à niveau de la surveillance opérationnelle. Divers fournisseurs sont venus sur place pour présenter quelques systèmes très coûteux et combinés avec des alternatives moins chères à comparer.
L’un d’eux est Hyperic , également disponible en tant que solution open source gratuite. J'ai été impressionné par ses capacités livrées et son extensibilité pour les agents personnalisés.
la source
Pour surveiller les statistiques (utilisation de la mémoire, charge, activité mysql, activité apache, etc.), j'utilise Munin . Hors de la boîte, il suit déjà beaucoup de choses et trace des graphiques pour différents intervalles de temps (dernières 24 heures, 7 derniers jours, mois dernier, année dernière). Grâce aux plugins, encore plus de choses peuvent être surveillées. Ses résultats sont des pages HTML avec de jolis graphiques.
Munin a une architecture maître / nœud: les nœuds rassemblent les statistiques sur un serveur et le maître stocke les données et produit du HTML et des graphiques.
J'utilise Monit pour suivre les processus en cours et pour redémarrer ou m'avertir lorsque certaines conditions configurables se présentent (charge élevée du processeur, utilisation importante de la mémoire, absence de réponse HTTP, etc.). Monit peut également surveiller des aspects plus généraux d'un serveur, tels que le processeur. charge, utilisation de la mémoire, statut du disque dur ou utilisation du disque.
Monit doit être configuré pour chaque service ou matériel que vous souhaitez surveiller et savoir comment réagir en cas de problème. Les options les plus utilisées sont de ne rien faire, d'envoyer un e-mail d'alerte ou de redémarrer le service.
Monit est excellent lorsque cela fonctionne, mais parfois, il ne parvient pas à démarrer, arrêter ou redémarrer un service et il n’ya pas beaucoup d’informations de diagnostic disponibles pour vous dire ce qui ne va pas. Cela signifie que vous ne savez pas si le problème vient de votre service ou de la configuration de Monit, qui s'exécute dans un environnement minimal semblable à celui de cron.
Les deux outils sont disponibles par défaut sur la plupart des distributions Linux.
la source
Je suis surpris que personne n'ait mentionné logwatch ou logcheck pour les serveurs linux - vous fait gagner une tonne de temps à lire les journaux !!
la source
J'utilise Pingdom pour surveiller mon serveur. Il m'envoie un SMS lorsque le serveur est inaccessible.
la source
Notre projet utilise Ganglia pour nos 100 grappes de nœuds. L’une des raisons pour lesquelles nous l’utilisons est que c’est l’outil de surveillance fourni avec Rocks .
Il est important pour nous d'avoir une très faible surcharge sur chaque nœud afin que le plus de ressources possibles soient disponibles pour le calcul. Ganglia nous donne un bon aperçu du cluster et nous permet d’explorer des nœuds individuels si nécessaire. En plus de savoir ce qui se passe actuellement, nous pouvons avoir un bon aperçu de ce qui s’est passé au cours de la dernière heure, du jour, de la semaine, du mois et de l’année. Les graphiques de diverses statistiques sont basiques et fonctionnels.
la source
Tout dépend de ce que vous entendez par "moniteur"!
la source
Graphite ( http://graphite.wikidot.com/ ) est un nouvel entrant sur le marché qui cherche à concurrencer Cacti et les solutions basées sur RRDTool .
RRDTool est remplacé par un magasin de support appelé Whisper. La documentation donne une assez bonne idée de la raison pour laquelle cela diffère et j'aime beaucoup l'interface de ligne de commande pour la représentation graphique ad hoc dans le cadre d'une enquête.
la source
Nous utilisons (et apprécions ) WhatsUp d’ Ipswitch pour notre réseau Windows relativement petit. Il est facile à installer et relativement facile à gérer. Il sait comment gérer les serveurs Windows ainsi que les outils standard.
Pour les grands réseaux, les réseaux non orientés Windows, ou les réseaux comportant de nombreux éléments variés, je recommande vivement OpenNMS . Le logiciel OpenNMS est gratuit et l'entreprise est plus que ravie de vendre des services de support et d'implémentation. Il arrive aussi qu’il soit géré par un ami très fort du collège!
la source
Pour ceux qui n’aiment pas l’interface Web de Nagios, il existe NPC , un plugin pour Cacti qui rend l’interface utilisateur de Nagios disponible depuis Cacti, mais avec une meilleure apparence (ajax, etc.).
Il lit dans une base de données fournie par NDO2DB , ce qui est un excellent moyen de rendre votre infrastructure disponible à partir d'une base de données pour pouvoir être utilisée dans des scripts et d'autres outils.
la source
Nous utilisons actuellement PRTG de Paessler . C'est excellent. Aucun agent requis, excellente interface Web Ajax, journalisation historique, graphique, WMI, etc. Il existe une version gratuite de 10 capteurs, mais nous en avons obtenu quelques-uns pour la version entreprise. Argent bien dépensé.
la source
Hobbit - c'est une version plus rapide et meilleure de Big Brother (qui semble être commercialement alarmante de nos jours).
http://hobbitmon.sourceforge.net/
la source
Si vous êtes pressé et que vous voulez un outil rapide pour surveiller votre serveur MS, utilisez ensuite l'Analyseur de performances pour Windows, configurez un journal des compteurs avec un modèle de surveillance personnalisé et un calendrier personnalisé (par exemple: collecter des données toutes les 5 heures). Ensuite, téléchargez les outils d’analyse des performances (Log Analysis) de PAL (Logpalarser) de Microsoft et de Codeplex ( http://pal.codeplex.com/ ) pour créer votre journal de compteur. PAL générera un excellent rapport documenté avec des liens vers des documents / outils de résolution de problèmes éventuels.
la source
J'utilise une combinaison de Solarwinds, d'onglets de performances du serveur VMware et de scripts personnalisés.
Le moniteur de performances réseau Solarwinds Orion est ce que j’utilise avec notre système Windows. administrateurs sur mes serveurs web. Des statistiques utiles sur les applications continuent de s'exécuter, mais il contient de bonnes informations sur les éléments de base au niveau de la boîte (disque, réseau, processeur).
Pour mes invités VMware, j'adore les onglets de performance.
Pour mes serveurs Sun, lorsque j'ai besoin de quelque chose qui n'est pas disponible dans Solarwinds (parce que notre administrateur ne l'a pas ajouté ou quoi), j'écris des scripts personnalisés (généralement en Perl) pour surveiller des éléments tels que la santé des miroirs, l'utilisation de swap, etc.
Je voudrais en savoir plus sur Solarwinds, mais comme il n'y a que 26 heures par jour (ou du moins mon patron le croit), je trouve que cela peut être un peu contraignant ...
la source
Nous utilisons OpsView , qui fonctionne au-dessus de Nagios. WebUI nous aide à déployer de nouvelles définitions de moniteur hôte sans avoir à autoriser l'accès SSH, fournit des vues publiques et enregistre des valeurs historiques. C'est pratique pour l'approvisionnement et la détermination de lignes de base appropriées.
la source
Zabbix ( http://www.zabbix.com ) est également bon et plus facile à installer que Nagios.
la source
Désolé de le dire, mais j'ai fini par utiliser de nombreux scripts personnalisés. Bien que loin d'être idéal, je doute qu'il existe une solution plus commune.
la source
Nous avons écrit notre propre logiciel de surveillance. Notre code n'est pas aussi sophistiqué qu'un paquet commercial, mais nous n'avions pas besoin de beaucoup de fonctionnalités. Il était plus facile d’écrire le nôtre que d’enquêter sur d’autres packages et d’apprendre à les utiliser. Le code fait exactement ce que nous voulons et il est facile à étendre.
la source