Comment surveiller et enregistrer les températures et la charge matérielles du serveur

15

Je cherche un moyen de consigner et de surveiller les températures et la charge matérielle de mon serveur (comme pour le CPU ou la RAM). Comment pourrais-je faire ça?

L'objectif est de:

  • s'assurer que le matériel ne chauffe pas
  • identifier ce qui devrait être mis à niveau et ce qui est en excès (comme peut-être apprendre peut-être ne pas obtenir un si bon processeur par exemple)

Ok je peux utiliser l'une des applets qui vivent dans la barre des tâches mais qu'en est-il de la journalisation ?

Jiew Meng
la source

Réponses:

18

Si vous voulez quelque chose qui ne dépend pas d'un bureau :

Jetez un œil aux capteurs lm Installer des capteurs lm . D'après la description:

Lm-sensor est un package de surveillance de la santé du matériel pour Linux. Il permet
vous permet d'accéder à des informations sur la température, la tension et la vitesse du ventilateur 
capteurs. Il fonctionne avec la plupart des nouveaux systèmes.

Ce package contient des programmes pour vous aider à configurer et à lire les données de
lm-capteurs.

Depuis leur page de projet (édition 2016: le projet est mort. Notre propre wiki contient des informations ):

  • Serveur haut de gamme sans surveillance, routeur ou autre surveillance automatisée des machines critiques. Créez facilement une tâche cron pour interroger l'état de votre matériel et vous envoyer un e-mail en cas de problème avant qu'il ne devienne critique. De cette façon, vous pouvez être alerté en quelques secondes d'un composant critique défaillant tel qu'une alimentation, un ventilateur, un autre mécanisme de refroidissement, ou même détecter si le boîtier a été ouvert.
  • Systèmes embarqués sous Linux. Ceux-ci peuvent utiliser ce package pour surveiller les tensions, les températures, les vitesses des ventilateurs, etc. en utilisant des composants standard et en utilisant une gamme d'interfaces de bus (par exemple ISA, SMBus, I2C ou SPI).
  • Plus généralement, l'acquisition de données. Mesurez facilement divers types de données (vitesses de rotation, tensions, températures, etc.) à l'aide de pièces standard pas chères. Très utile pour l'automatisation des systèmes (à la maison, en atelier, en station météo, vous l'appelez).

lm-sensor possède un démon, appelé sensord, qui utilise RRDtool pour «système d'enregistrement et de représentation graphique des données de séries chronologiques». Il comprend donc des graphiques comme celui-ci qui peuvent être affichés via un serveur Web:

im1

(extrait de la page du projet lm-sensor).

Pour installer le démon sensord, vous devrez probablement installer le package sensord.

Exemple de mon carnet:

im2

Le fichier de configuration pour cela se trouve à /etc/sensors3.conf

lm-sensorsest en quelque sorte la base de toute mesure de température. Les éléments du bureau sont plus que susceptibles d'obtenir leurs informations de ce package. Un exemple Si vous voulez quelque chose qui dépend d'un bureau

psensor.

  • carte mère et capteurs CPU ( nécessite l'installation de capteurs lm ).
  • GPU NVidia
  • Disques durs (nécessite l'installation de hddtemp).
  • Vitesse du ventilateur (encore une fois, nécessite l'installation de capteurs lm).

Installation en ajoutant un PPA:
sudo add-apt-repository ppa:jfi/ppa
sudo apt-get update && sudo apt-get install psensor

(Oneiric aura un psensor inclus)

(ancien) exemple de ubuntugeek.com : im6

Rinzwind
la source
On dirait une excellente réponse. On dirait que les images et les liens sont brisés. : - /
user121330
Cette image n'est que l'icône du programme d'installation ;-) Voir meta.askubuntu.com/a/1853/15811 sur ce qu'il faut faire (n'importe qui peut le changer en hostmar.co/software-small ou hostmar.co/software-large ). Mais le projet lui-même est mort .... dommage: * (
Rinzwind
5

Si des programmes comme Cacti sont trop, alors il y a un script qui se connecte simplement au fichier texte par jour - exécutez-le avec crontab. Mais doivent être installés programme lm-capteurs.

#!/bin/bash
_now=$(date +"%Y_%m_%d")
_file="temp_log_$_now.txt"
(date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file"
Darius.V
la source
4

Pour la journalisation du cpu / ram / températures / trafic sur un serveur , j'ai recommandé Cacti . Il est annoncé comme une «interface complète pour RRDtool » et peut avoir des sources de données multipliées telles que des capteurs lm, SNMP ou même des scripts personnalisés. Les données sont stockées dans RRD et utilisées pour créer des graphiques quotidiens, hebdomadaires, mensuels et annuels.

Consultez le site Web de Cacti pour plus de détails, des captures d'écran et des liens vers des exemples de sites en direct. Il peut être difficile à configurer la toute première fois, mais cela en vaut la peine à la fin.

drgrog
la source
2
l'exigence d'installation de MySQL limite ses cas d'utilisation
Scott Stensland
3

J'utilise Zenoss pour surveiller environ 70 serveurs Unix et Windows dans mon bureau. Nous surveillons également tous les équipements réseau, et même un thermostat dans la salle des serveurs. La plupart se fait via SNMP. (cependant, nous utilisons des scripts écrits personnalisés pour surveiller les performances de certaines applications)

La plupart des serveurs (tels que Dell et HP) ont des capteurs de température internes, que vous pouvez interroger à l'aide de SNMP. Vous pouvez également surveiller les processus, l'utilisation du processeur, le débit du réseau, etc. Je reçois des alertes si les serveurs se déconnectent ou commencent à utiliser trop de processeur ou si les processus critiques tombent en panne.

Sérieusement, je ne peux pas insister assez pour regarder des choses comme zenoss , hyperic et nagios ! les versions gratuites peuvent surveiller plusieurs systèmes, mais elles peuvent également en surveiller un seul. Ils vous aident à résoudre les problèmes et à découvrir ce qu'un serveur faisait à 2 heures du matin en cas de problème.

Brian
la source
1

vérifiez ce lien: https://launchpad.net/indicator-sysmonitor

im1

(de OMG Ubuntu )

Installation:

sudo add-apt-repository ppa:alexeftimie/ppa
sudo apt-get update && sudo apt-get install indicator-sysmonitor

Remarque: ne fonctionne que dans Natty / 11.04

George
la source
c'est peut-être une question très stupide, mais comment l'installer? J'ai essayé sudo add-apt-repository 'deb http://ppa.launchpad.net/alexeftimie/ppa/ubuntu natty main'et sudo apt-get install indicator-sysmonitorpuisUnable to locate package indicator-sysmonitor
Jiew Meng
@jiewmeng J'ai édité une image et une méthode d'installation
Rinzwind
1

J'utilise pandora fms pour surveiller environ 40 serveurs et 100 systèmes informatiques dans mon entreprise ainsi que sa page Web. Vous pouvez trouver utile d'installer un agent logiciel sur votre serveur et de configurer des modules locaux pour surveiller ce dont vous avez besoin. Si vous souhaitez l'essayer ici, vous pouvez visiter la page Web de pandora: Panndora FMS Unified Monitoring Tool

Cordialement

Ivo Yordanov

ivo_yordanov
la source
1

Vérifiez le paquet munin , il peut surveiller presque tout.

https://help.ubuntu.com/lts/serverguide/munin.html https://wiki.ubuntuusers.de/munin

sudo apt-get install apache2
sudo apt-get install munin-node`
sudo systemctl enable munin-node
sudo a2enconf munin

Vérifiez l'autorisation d'accès dans /etc/apache2/conf-enabled/munin.conf qui ressemble à ceci:

<Directory /var/cache/munin/www>
    Require all granted
    AllowOverride None
    Order Allow,Deny
    Allow from all
    Options None
</Directory>

<Location /munin-cgi/munin-cgi-graph>
    Require all granted
    <IfModule mod_fcgid.c>
        SetHandler fcgid-script
    </IfModule>
    <IfModule !mod_fcgid.c>
        SetHandler cgi-script
    </IfModule>
</Location>

Redémarrez apache2:

sudo apache2ctl restart

Lancez votre navigateur pour: http: // localhost / munin - profitez-en.

Regardez dans / etc / munin pour d'autres options.

Thomas
la source