Tâches Sysadmin quotidiennes / hebdomadaires / mensuelles / annuelles

8

Cela devrait probablement être un wiki communautaire. J'essaie de dresser une liste de toutes les tâches d'administrateur système que nous devrions effectuer régulièrement, car je pense que nous n'en faisons pas assez dans notre entreprise. L'attitude ici est que la résolution des problèmes n'est pas pratique, mais nous n'avons pas le temps de faire une maintenance préventive ou une amélioration continue.

Du quotidien:

  • échange de bande / lecteur de sauvegarde tous les soirs
  • vérifier que les mises à jour antivirus ont été déployées sur tous les systèmes

Hebdomadaire:

  • échange de bande / lecteur de sauvegarde hebdomadaire
  • nettoyer les fichiers temporaires de tous les systèmes
  • défragmenter tous les systèmes

Mensuel:

  • planifier les améliorations de l'infrastructure
  • livrer / envoyer des équipements obsolètes au recycleur d'électronique
  • reconstruire ou remplacer des postes de travail vieillissants
  • test de restauration à partir d'une sauvegarde

Annuel:

  • reconstruire ou remplacer des serveurs vieillissants
  • remplacer les batteries de l'onduleur
Scott
la source
Vous avez raison, ce devrait être un wiki communautaire. Aussi, ne soyez pas trop pressé de séparer des tâches comme ça. Par exemple, la planification, la reconstruction des machines, etc. doivent être effectuées selon les besoins, et non assignées comme une tâche hebdomadaire (ou toute autre période spécifique).
John Gardeniers

Réponses:

7

Si vous ne disposez pas de suffisamment de temps pour effectuer une maintenance préventive et que vous passez la majeure partie de votre temps à résoudre des problèmes, toute votre méthodologie doit être révisée. Plutôt que de vous dire ce que vous devriez faire à chaque période, je vais vous donner quelques idées pour que vous n'ayez pas à faire les choses.

Fist up, vous avez besoin d'un bon système de surveillance et d'autant d'automatisation que vous pouvez gérer. Ces deux éléments devraient libérer plus de temps que de nombreux administrateurs ne le pensent jusqu'à ce qu'ils soient bien configurés.

Voici quelques-unes des choses que votre système de surveillance devrait faire pour vous:

  • Vous alerter lorsque les files d'attente de filtre de courrier ou de spam deviennent trop volumineuses ou trop soudaines.
  • Vous alerter lorsque l'espace disque devient trop faible, l'utilisation du processeur devient trop élevée, etc.
  • Enregistrez des choses comme l'utilisation du disque afin de voir les tendances au fil du temps.
  • Même chose avec les boîtes aux lettres.
  • Vous alerter lorsque le pare-feu enregistre un nombre anormal de hits.
  • Même chose pour tout ce qui sert le monde extérieur. par exemple DNS et serveurs Web.
  • Vous avertir si les mises à jour AV sont trop anciennes ou si le logiciel AV est éteint ou désinstallé sur une machine.

La défragmentation ne devrait même pas figurer sur votre liste de tâches car elle devrait être un processus automatisé. À l'intervalle souhaité, le serveur exécute des vérifications de disque et une défragmentation après un redémarrage. Envisagez de lier cela à un système pour installer les mises à jour et les correctifs en file d'attente (qui ont déjà été testés sur une machine hors production).

Les dossiers temporaires peuvent également être nettoyés avec l'automatisation. Je crée une application simple qui se déclenche après un redémarrage qui attend 10 minutes, puis nettoie tous les emplacements temporaires. Le délai est de s'assurer qu'il ne supprime pas les fichiers qui peuvent être nécessaires pour une installation ou une mise à niveau qui se termine après le redémarrage (appris à la dure!).

Une chose que vous devez faire manuellement à la période qui vous convient est de surveiller le système de surveillance et l'automatisation, juste pour être sûr. Je vérifie le mien quotidiennement, mais je n'ai pas rencontré de problème depuis plus d'un an.

Lorsque vous obtenez votre système et votre automatisation, assurez-vous également d'avoir un système de contrôle de version pour le mettre en place. Il peut être très ennuyeux de découvrir que le dernier petit ajustement a cassé quelque chose d'autre, mais vous ne vous souvenez pas exactement de ce que vous avez changé.

John Gardeniers
la source
Quel système de surveillance unique peut faire tout cela? S'il existe, je le veux!
Cypher
@Cypher, vous pensez trop étroitement. Un système de surveillance unique comprendra normalement plusieurs composants, tels que Nagios et MRTG, tout comme un système d'exploitation est plus d'un composant.
John Gardeniers
Je suppose que j'espérais vraiment avoir raté un outil incroyable qui pourrait remplacer la douzaine d'outils que j'utilise actuellement pour toutes ces choses. :) +1 pour les outils d'automatisation et de surveillance automatisée: si je dois faire quelque chose plusieurs fois, il est automatisé.
Cypher
@Cypher, ce bilan incroyable que vous recherchez n'est rien de plus que l'ordinateur lui-même. Faites-le travailler pour vous, plutôt que de travailler pour lui. ;)
John Gardeniers
1

Dans Daily, je devais vérifier les journaux des événements, manuellement ou via un script quelconque.

Peut-être que le mensuel pourrait inclure des mises à jour du système d'exploitation?

Je dirais également chaque année de jeter un œil à la maintenance / garantie de vos serveurs.

Christophe
la source
1

Mensuel:

  • revoir l'utilisation de l'infrastructure - ceci est sans doute intégré au bit «planifier les améliorations de l'infrastructure», mais vous ne pouvez pas faire de plans à moins que vous ne sachiez (c'est-à-dire «ayez des données solides») quels bits doivent être améliorés.

Trimestriel:

  • Tester le basculement de l'infrastructure - de la couche d'application (serveur Web, courrier électronique) à la couche réseau (commutateur, liaison réseau) à la couche physique (alimentation), si vous avez une redondance dans le système que vous pensez pouvoir vous sauver, il doit être entretenu et testé périodiquement.
pjz
la source
1

Voici quelques sauvegardes mensuelles auxquelles vous n'auriez peut-être pas pensé:

1) Même s'il est automatisé, je copie toujours ma configuration de commutateur de réseau principal sur une machine locale
2) Configurations de pare-feu
3) Configurations SAN
4) configurations ISA exportées (victoire 2003)
5) Réservations statiques DHCP (victoire 2008)
6) Entrées DNS (victoire 2008)
7) Clés de chiffrement (stockées dans des fichiers binaires) vers KeePass, d'autant plus que nos sauvegardes sont chiffrées - également enregistrées en dehors de nos systèmes de sauvegarde
8) notre dossier de documentation informatique, également enregistré en dehors de nos systèmes de sauvegarde
jftuga
la source
0

Dans Daily, je pourrais recommander que vous ajoutiez l'abonnement aux listes de diffusion bien connues des vulnérabilités de correctifs et que vous ayez un processus sur les correctifs / mises à jour.

Cela peut ne se produire qu'une fois par mois, mais il suffit d'un seul message manqué sur une vulnérabilité des produits pour provoquer de nombreuses perturbations.

Je pense que cela pourrait être réduit en quelques mots pour tenir sur une seule ligne, si vous êtes d'accord.

BTW; Ceci est une grande liste, j'ai hâte de voir son achèvement /.

Nick O'Neil
la source
0

Audits internes:

  • Comparez les systèmes mis en ligne avec la liste des systèmes en cours de sauvegarde. Quelque chose s'est-il glissé dans la production sans sauvegarde? (au moins une fois par mois, sinon plus souvent, selon le montant déployé)
  • Allez visiter vos bandes si vous avez un coffre-fort hors site. Assurez-vous qu'ils sont là où ils sont censés être. (une ou deux fois par an)
damorg
la source