Cela devrait probablement être un wiki communautaire. J'essaie de dresser une liste de toutes les tâches d'administrateur système que nous devrions effectuer régulièrement, car je pense que nous n'en faisons pas assez dans notre entreprise. L'attitude ici est que la résolution des problèmes n'est pas pratique, mais nous n'avons pas le temps de faire une maintenance préventive ou une amélioration continue.
Du quotidien:
- échange de bande / lecteur de sauvegarde tous les soirs
- vérifier que les mises à jour antivirus ont été déployées sur tous les systèmes
Hebdomadaire:
- échange de bande / lecteur de sauvegarde hebdomadaire
- nettoyer les fichiers temporaires de tous les systèmes
- défragmenter tous les systèmes
Mensuel:
- planifier les améliorations de l'infrastructure
- livrer / envoyer des équipements obsolètes au recycleur d'électronique
- reconstruire ou remplacer des postes de travail vieillissants
- test de restauration à partir d'une sauvegarde
Annuel:
- reconstruire ou remplacer des serveurs vieillissants
- remplacer les batteries de l'onduleur
Réponses:
Si vous ne disposez pas de suffisamment de temps pour effectuer une maintenance préventive et que vous passez la majeure partie de votre temps à résoudre des problèmes, toute votre méthodologie doit être révisée. Plutôt que de vous dire ce que vous devriez faire à chaque période, je vais vous donner quelques idées pour que vous n'ayez pas à faire les choses.
Fist up, vous avez besoin d'un bon système de surveillance et d'autant d'automatisation que vous pouvez gérer. Ces deux éléments devraient libérer plus de temps que de nombreux administrateurs ne le pensent jusqu'à ce qu'ils soient bien configurés.
Voici quelques-unes des choses que votre système de surveillance devrait faire pour vous:
La défragmentation ne devrait même pas figurer sur votre liste de tâches car elle devrait être un processus automatisé. À l'intervalle souhaité, le serveur exécute des vérifications de disque et une défragmentation après un redémarrage. Envisagez de lier cela à un système pour installer les mises à jour et les correctifs en file d'attente (qui ont déjà été testés sur une machine hors production).
Les dossiers temporaires peuvent également être nettoyés avec l'automatisation. Je crée une application simple qui se déclenche après un redémarrage qui attend 10 minutes, puis nettoie tous les emplacements temporaires. Le délai est de s'assurer qu'il ne supprime pas les fichiers qui peuvent être nécessaires pour une installation ou une mise à niveau qui se termine après le redémarrage (appris à la dure!).
Une chose que vous devez faire manuellement à la période qui vous convient est de surveiller le système de surveillance et l'automatisation, juste pour être sûr. Je vérifie le mien quotidiennement, mais je n'ai pas rencontré de problème depuis plus d'un an.
Lorsque vous obtenez votre système et votre automatisation, assurez-vous également d'avoir un système de contrôle de version pour le mettre en place. Il peut être très ennuyeux de découvrir que le dernier petit ajustement a cassé quelque chose d'autre, mais vous ne vous souvenez pas exactement de ce que vous avez changé.
la source
Dans Daily, je devais vérifier les journaux des événements, manuellement ou via un script quelconque.
Peut-être que le mensuel pourrait inclure des mises à jour du système d'exploitation?
Je dirais également chaque année de jeter un œil à la maintenance / garantie de vos serveurs.
la source
Mensuel:
Trimestriel:
la source
Voici quelques sauvegardes mensuelles auxquelles vous n'auriez peut-être pas pensé:
la source
Dans Daily, je pourrais recommander que vous ajoutiez l'abonnement aux listes de diffusion bien connues des vulnérabilités de correctifs et que vous ayez un processus sur les correctifs / mises à jour.
Cela peut ne se produire qu'une fois par mois, mais il suffit d'un seul message manqué sur une vulnérabilité des produits pour provoquer de nombreuses perturbations.
Je pense que cela pourrait être réduit en quelques mots pour tenir sur une seule ligne, si vous êtes d'accord.
BTW; Ceci est une grande liste, j'ai hâte de voir son achèvement /.
la source
Audits internes:
la source