Dernièrement, j'ai dû faire face à des temps d'arrêt sur certains des sites Drupal que j'ai déployés. Je voudrais aborder le problème de manière proactive, plutôt que de réagir à ces temps d'arrêt en redémarrant les services ou le serveur lui-même. J'ai lu sur les outils de surveillance comme nagios, munin, cacti, etc. pour surveiller la santé de votre serveur / infrastructure, mais je n'en ai pas vraiment essayé un en production. Je traite avec Drupal presque 99% des fois, et je voudrais trouver des suggestions pour la surveillance au niveau du serveur et la surveillance au niveau Drupal (code d'application).
Fondamentalement, je voudrais être averti lorsque la charge du serveur est élevée, pouvant être dirigée vers le coupable (ou la victime), afin que je puisse prendre des décisions éclairées. Je voudrais également savoir ce que les gens utilisent pour la surveillance de niveau Drupal (comme l'emailing) quand il y a une erreur / un avertissement PHP. (Que se passe-t-il lorsque le serveur de messagerie lui-même est en panne?)
la source
Indépendamment de ce que vous utilisez, la seule chose que je suggérerais certainement est - à moins que vous n'ayez un personnel informatique à plein temps - ne maintenez pas votre propre surveillance: comptez sur un service qui est complètement indépendant de vos serveurs. C'est une chose d'avoir un serveur accessible au public, c'est une autre de l'avoir et de ne pas le savoir parce que votre serveur de surveillance est également en panne. La plupart des services de surveillance comprendront toutes les exigences que vous avez énumérées hors de la boîte.
Mais au risque de devenir une question de recommandation d'achat, le service que j'utilise pour les exigences que vous avez énumérées est Pingdom :
la source
Voici quelques suggestions Drupal-agnostiques:
En ce qui concerne l'application Drupal elle-même, je suggérerais d'utiliser Xdebug + Webgrind ou XHProf pour profiler le code et garder un œil sur cette question: Meilleur moyen de comparer les performances de la pile Drupal
la source
J'aime pingdom pour les sites petits / moyens car il est utile: il vous dit que quelque chose ne va pas du point de vue du client, ce qui est exploitable. Des choses comme la moyenne de charge ne signifient vraiment rien, sauf si vous avez une pile extrêmement mal configurée (que vous ne devriez pas) ou si vous vous faites marteler par Digg / Reddit (auquel cas il n'y a rien que vous puissiez faire de toute façon, vous devriez avoir préparé).
Du blog de Ted Dziuba:
Lisez le billet de blog, c'est hilarant.
la source
J'utilise check_drupal pour surveiller divers sites drupal. Il s'agit d'un plugin nagios qui ne nécessite aucune modification de code sur un site drupal lui-même. La seule exigence est que le drush doit être présent sur le serveur.
la source