Comment puis-je atténuer la nécessité d'une intervention manuelle avec Raspberry Pis déployé à distance?

13

Je travaille sur un projet qui utilise Raspberry Pis qui sera déployé sur plusieurs sites. Ils ont du matériel spécial attaché à des fins d'automatisation et exécutent un service Web (que j'ai écrit) pour accéder au matériel. Nous déploierons occasionnellement de nouveaux logiciels sur le Pis - méthode encore à déterminer - et c'est un grand sujet de préoccupation.

Ma question: pouvez-vous nommer quelques idées ou meilleures pratiques pour atténuer le besoin d'une intervention manuelle en cas de problème? Je me demande s'il existe un type de solution de surveillance permettant au Pi de redémarrer normalement en cas de blocage (peut-être une incapacité à téléphoner à la maison?), Et s'il n'est toujours pas fonctionnel, redémarre dans une partition de sécurité qui peut "téléphoner à la maison" pour une solution (soit réimaginer, soit refaire un redémarrage normal en cas de panne de réseau).

Je ne sais vraiment pas exactement ce que je recherche, juste des moyens qui nous empêcheront d'appeler ou d'envoyer des gens pour faire des redémarrages manuels ou des réimages. Un schéma de partitionnement double semblait utile, mais il y a peut-être de meilleures idées.

BobIsNotMyName
la source
1
Pour commencer, jetez un œil ici raspberrypi.stackexchange.com/questions/1401/…
Steve Robillard
Merci .. J'ai regardé ça, mais pas trop de nouveautés là-bas. Je sais que l'utilisation du chien de garde matériel aidera dans une certaine mesure.
BobIsNotMyName

Réponses:

6

Cette réponse n'est pas spécifique au Raspberry Pi, mais est un conseil général pour les serveurs administrés à distance.

  1. ssh. Utiliser un shell sécurisé est presque aussi bon que d'y être.

  2. console série et administration hors bande: si vous bousiller votre interface réseau ayant une deuxième façon de se connecter est une bouée de sauvetage. un moyen simple serait d'avoir une machine de sauvegarde identique fonctionnant comme une redondance d'UC avec une paire de connexions série entre elles afin que chacune puisse recharger l'autre.

  3. contrôle de l'alimentation à distance: de nombreux centres de données peuvent alimenter à distance les serveurs non fonctionnels. cher mais très agréable.

  4. e-mail: si vous installez nullmailer et logwatch, vous obtenez des rapports d'état quotidiens qui peuvent aider à détecter les échecs tôt.

  5. Remarque spécifique à rpi: ne stockez pas / var ou / tmp sur une carte SD, cela raccourcira la durée de vie de la carte SD.

hildred
la source