ec2 a redémarré mon instance?

17

J'ai découvert que mon serveur CentOS 5 sur EC2 a été redémarré, sans ma commande pour le faire. Je ne me suis même pas connecté le jour du redémarrage. Quand je regarde «dernier» sous linux, il dit:

jeroen   pts/0        128.97.......    Thu Apr  7 15:02 - 16:28  (01:25)    
reboot   system boot  2.6.18-xenU-ec2- Wed Apr  6 15:48         (1+05:27)   
jeroen   pts/2        128.97.......    Tue Apr  5 19:31 - 23:17  (03:45)

Il semble donc que personne ne se soit connecté ce jour-là. Des suggestions sur ce qui aurait pu arriver? EC2 redémarre-t-il les instances en toutes circonstances? Ou pourrait-il être piraté?

Jeroen
la source
Il y a un fil reddit intéressant à ce sujet ...
Ivan Aracki

Réponses:

27

Cela se produit occasionnellement lorsque Amazon cherche à mettre hors service le serveur physique sur lequel votre instance s'exécute. Ils pourraient tuer le serveur pour remplacer un composant matériel défaillant ou le serveur pourrait tout simplement avoir atteint sa fin de vie. Quoi qu'il en soit, d'après ce que je comprends, leur processus fonctionne comme ceci:

  • Le serveur physique est marqué comme étant hors service, donc aucune nouvelle instance n'est lancée dessus.
  • S'ils le peuvent (par exemple, ils ne traitent pas d'une défaillance matérielle critique), Amazon attendra un certain temps pour voir si les instances s'exécutant sur le serveur s'arrêtent ou redémarrent de leur propre chef (le redémarrage d'une instance EC2 entraîne généralement son obtention). lancé sur un autre serveur physique).
  • Une fois cette période terminée, Amazon forcera les instances restantes à redémarrer en les déplaçant vers d'autres serveurs physiques.

En règle générale, en raison de cela et d'autres bizarreries de l'environnement, vous devez traiter tout serveur individuel fonctionnant sur EC2 comme éphémère. Tout serveur peut redémarrer ou disparaître à tout moment. Il est donc essentiel d' automatiser le déploiement avec quelque chose comme chef ou marionnette , d'avoir une surveillance solide et de concevoir votre application pour contourner les échecs.

SeanOC
la source
C'est terrible - je reçois le coup de pouce pour créer des instances éphémères mais s'ils veulent retirer un hôte, ils devraient xen
Donc, pas de vMotion (ou son équivalent)? D'oh.
Massimo
Votre cadre d'automatisation et de surveillance doit vérifier cela. C'est également la raison pour laquelle vos applications doivent être écrites pour utiliser Elastic Load Balancers.
Magellan
De plus, vous commentez une question de 4 ans. Vous n'obtiendrez pas de réponse du PO.
Magellan