À quelle fréquence les serveurs Windows doivent-ils être redémarrés?

77

Un peu d’arrière-plan: Nous avons plusieurs serveurs Windows (2003, 2008) pour notre département. Nous sommes une division informatique, nous gérons donc nos propres serveurs. Parmi nous quatre, je suis le seul à posséder un peu de connaissances en informatique. (Notez la "légère quantité".) Mon patron dit que les serveurs doivent être redémarrés au moins une fois par semaine. Je ne suis pas d'accord. Notre service informatique affirme que, parce qu'elle les redémarre constamment, c'est la raison pour laquelle nos disques durs tombent en panne et que des blocs d'alimentation leur sont coupés. (Cela est arrivé à quelques-uns de nos serveurs à quelques reprises au cours des quatre dernières années et très récemment.)

La question est donc la suivante: à quelle fréquence tout le monde redémarre-t-il ses serveurs Windows? Existe-t-il une norme ou une recommandation de l'industrie? Notre service informatique a-t-il raison de dire que, parce que nous redémarrons, c'est pourquoi nous avons des problèmes de matériel? (J'ai besoin d'une raison si je vais changer d'avis!)

Evan
la source
111
Oh, à peu près tous les deuxièmes mardi du mois . :)
Jscott
4
Dang! Nous faisions le quatrième jeudi du mois! :)
Evan
2
Je suis dans le bateau opposé. Nous ne sommes pas autorisés à redémarrer les serveurs sans un débat d'une semaine entre l'ensemble du département, qui prend environ 12 heures de travail par serveur. Oui, cela inclut les redémarrages pour les correctifs, ce qui signifie que cela ne se fait jamais.
Hyppy
19
Le redémarrage hebdomadaire ne devrait pas non plus entraîner une augmentation drastique des défaillances matérielles.
James Ryan
3
Il semble que vos serveurs soient redémarrés plus souvent que mon ordinateur portable. Je passe généralement en mode veille lorsque je ne l'utilise pas. La raison habituelle du redémarrage est l’installation de mises à jour Windows ou de logiciels.
Phil

Réponses:

116

Mon patron dit que les serveurs doivent être redémarrés au moins une fois par semaine

Je suis fortement en désaccord. Microsoft a fait de grands progrès depuis les bons jours [NT, tout le monde?] En ce qui concerne la stabilité et la disponibilité. C'est dommage que le consensus au sein du support informatique n'ait pas changé avec cela.

À quelle fréquence tout le monde redémarre-t-il ses serveurs Windows?

Uniquement en cas de nécessité - Soit en raison d'une mise à jour de logiciel / système d'exploitation, d'une défaillance logicielle critique qui ne peut pas être récupérée via d'autres méthodes, d'une mise à niveau / d'un remplacement matériel ou d'une autre activité ne pouvant se produire sans redémarrage. 1

Existe-t-il une norme ou une recommandation de l'industrie?

Je ne l' ai jamais vu une recommandation standard, en tant que tel , mais je ne pouvais pas d' accord avec toute recommandation [sauf de MS eux - mêmes] qui indiquerait un redémarrage nécessaire à un intervalle de temps spécifique « juste parce que ».

Notre service informatique a-t-il raison de dire que, parce que nous redémarrons, c'est pourquoi nous avons des problèmes de matériel?

Le redémarrage [et, plus encore, le cycle d'alimentation] est la période d'activité matérielle la plus stressante pour un ordinateur. Tout tourne presque à 100% - disques et ventilateurs ... ... ainsi que des fluctuations importantes de la température des composants. Le matériel moderne est incroyablement résistant, mais cela ne devrait pas être une raison pour simplement faire rebondir les serveurs, sur un coup de tête, quelques fois par semaine.

1 À part, je déteste quand les techniciens "redémarrent" juste un serveur Windows dans le cas d'un service défaillant, ou autre. Je comprends la nécessité de redémarrer le service, mais un redémarrage devrait être la dernière étape pour dépanner un serveur. Identifier et corriger [!] La cause première de l'échec ne devrait presque jamais aboutir à "Meh, redémarrez-le simplement ...."

jscott
la source
2
Merci pour la réponse complète. Nous faisons les mises à jour une fois par mois, ce que nous devons évidemment faire lorsque nous faisons ces mises à jour. J'apprécie la réponse.
Evan
5
Je ne suis pas d'accord avec votre addenda. Si le service définit le serveur (par exemple, un serveur NFS qui arrête le partage des exportations), et que vous savez qu'un redémarrage propre ramènera le service dans X minutes, et après un dépannage de base, vous déterminez qu'il faudra x + 5 pour résoudre le problème. problème, il est très opportun de simplement redémarrer. Vous pouvez faire une analyse de cause par la suite. Maintenant, c’est de toute façon ma méthode pour le faire, et vous pouvez argumenter pour et contre assez facilement :) Comment je roule.
Matthieu
34
@ Matthew: Effectuer une analyse de la cause après coup est très utile s'il n'y a pas d'informations transitoires sur la cause perdue lors du redémarrage. Je pense parler pour un certain nombre de personnes lorsque je disais que je préfèrerais avoir un temps d'indisponibilité plus long pour détecter une défaillance et réparer la cause première d'une panne, plutôt qu'un certain nombre d'incidents ayant une durée d'indisponibilité plus courte lorsque je décidais de "redémarrer simplement" et perdre potentiellement la possibilité d'utiliser des informations volatiles pour faciliter l'analyse des causes profondes.
Evan Anderson
8
@Matthew Dans les cas d'échec de service, je m'attendrais à ce que le technicien essaie de redémarrer le service , en tant qu'étape de dépannage, avant de redémarrer toute la boîte.
Jscott
6
@ Evan Je suis d'accord avec vous mais je pense qu'il doit y avoir un seuil d'incidents qui deviennent un problème. Par exemple, si cela se produit une fois par mois et est résolu en 10 minutes avec un redémarrage, l'entreprise peut ne jamais se soucier de la cause première. Je pense que vous et moi aimerions savoir, mais la disponibilité est plus importante que la cause fondamentale. Cependant, si cela se produit 3 fois par semaine, c'est une toute autre histoire.
Jim B
52

Les serveurs Windows doivent être redémarrés tous les mois si vous appliquez des correctifs. Vous appliquez des correctifs, non? Droite?

Hyppy
la source
8
+1 pour me rendre lol
3
Vous n'appliquez des correctifs que mensuellement?
John Gardeniers
À proprement parler, xe n'applique que les correctifs qui nécessitent eux-mêmes un redémarrage mensuel. Tous les PTF ne nécessitent pas un redémarrage, et toutes les mises à jour mensuelles ne contiennent même pas de tels correctifs.
JdeBP
2
Je ne redémarre les serveurs Windows que lorsqu'une mise à jour le requiert . Parfois, il se passera quelques mois sans un patch nécessitant un redémarrage. J'ai cependant des serveurs Linux qui n'ont pas redémarré depuis des années et fonctionnent sans anicroche. Je pense que le plus longtemps que j'ai vu dans mon réseau est une boîte Linux qui a été mise dans un placard et oubliée (elle a eu des mises à jour automatiques). Je suis rentré et la disponibilité était à 3 ans. Un an plus tard, il a été redémarré en raison d’une panne de courant.
James
S'il s'agissait de Linux ou de BSD, vous pourriez patcher votre serveur sans avoir besoin d'un redémarrage. Vous ne devez redémarrer que pour les mises à jour du noyau (et avec une distribution orientée serveur, celles-ci sont peu fréquentes).
SnakeDoc
18

Je vais donner une réponse alternative pour un cas très spécifique. Les avancées des deux ou trois dernières années ont peut-être changé cette situation, mais si vous utilisez des serveurs TS ou Citrix très utilisés qui exécutent de nombreuses applications interactives (comme Office), il est judicieux de procéder à des redémarrages hebdomadaires en dehors des heures de travail. Si vous souhaitez que votre batterie de serveurs soit configurée correctement et que les redémarrages soient échelonnés, même si vous utilisez peu les heures creuses, les utilisateurs ne devraient pas en être affectés.

Bien sûr, il s'agit de redémarrages réguliers des serveurs, mais ils sont utilisés comme des ordinateurs de bureau.

Mfinni
la source
4
Mm ... bon appel sur l'affaire TS / Citrix.
Hyppy
Expérience similaire dans l’utilisation de Citrix avec le logiciel de gestion des audits de CCH.
1
Il en a été de même à l'époque de MetaFrame, lorsque Citrix lui-même recommandait de redémarrer tous les soirs, si cela était pratique.
John Gardeniers
Ouais, Metaframe ... qui. Je ne manque pas de jouer avec le fichier de mappage du pilote d’imprimante. C’est certainement beaucoup mieux du point de vue de la gestion informatique.
Mfinni
10

Il s’agit plus d’un problème politique et psychologique que technique.

D'après mon expérience, certaines personnes qui travaillaient avec des versions beaucoup plus anciennes de Windows avaient bien compris qu'elles avaient besoin d'un redémarrage hebdomadaire, et elles avaient inscrit cette philosophie dans un petit coin de leur esprit (elles ne semblaient jamais remarquer le redémarrage est manquant quand ils sont en vacances, cependant). À moins de disposer de systèmes et d'applications très instables, ils ne sont plus basés sur la réalité.

D'un autre côté, des redémarrages fréquents peuvent catalyser une défaillance matérielle, mais ils ne sont pas très susceptibles d'en être la cause.

Shane Madden
la source
7
Mon patron est un bon ami de l'administrateur réseau à la retraite qui lui a dit qu'ils devaient être redémarrés au moins une fois par semaine ... ce qui explique pourquoi elle est si catégorique à ce sujet. Merci pour la réponse.
Evan
5
Pas étonnant qu'il soit "à la retraite" ... est-ce un euphémisme pour viré?
KCotreau
3

Ils doivent être redémarrés uniquement pour des raisons de maintenance si tout fonctionne correctement . Les redémarrages programmés ne sont véritablement requis que pour A) la mise à niveau du logiciel, B) la maintenance du matériel ou C) la gestion d’une fuite de mémoire qui ne peut pas être résolue en redémarrant le logiciel / service qui l’a provoquée. Bien que windows ne soit pas connu pour les longues périodes de disponibilité, cela arrive (le dernier emploi contenait des boîtes Win2k qui restaient en place pendant des mois - elles ont juste fonctionné). N'oubliez pas que toute correction nécessitera probablement un redémarrage.

Matthieu
la source
Merci pour la réponse. Cela devrait aider à la persuader.
Evan
1
J'ai trouvé des boîtes Windows NT, 2000 et 2003 sur le réseau de travail qui fonctionnent depuis un certain nombre d'années. et jusqu'à récemment, notre centre de données appliquait une politique de correction annuelle et avec plus de 600 serveurs, il n'était pas rare de voir des heures de plus de 250 jours. Mes serveurs (j'ai environ 120) Obtenez mis à jour et démarrez chaque correctif Microsoft. Parfois, comme le mois dernier, nous n'avions pas de cycle. La disponibilité dépend de ce qui fonctionne sur le serveur et de la manière dont les choses fonctionnent ensemble. 2003 R2 avec ce que je dois exécuter doit être redémarré tous les 35 jours. des trucs marrants se passent après
Christopher Thornton
2

Je ne suis en aucun cas un expert en la matière, mais selon les services que vous exécutez, certains risquent de déborder sur certaines fonctions de minutage, telles que timeGetTime () et getTickCount ().

timeGetTime a un résultat de 32 bits, ce qui correspond au nombre de millisecondes écoulées depuis le démarrage de l'ordinateur. Cela atteint environ 49,7 jours.

Matthieu
la source
2
Euh, non. J'ai un serveur (sur un réseau complètement isolé et digne de confiance - ne me prêche pas) qui est en place depuis presque 14 mois sans AUCUN effet pervers.
Ben Pilbrow
3
Je ne voulais pas dire que tous les serveurs et toutes les instances auraient ce problème, mais que si le serveur utilise un logiciel qui utilise ces fonctions et ne prend pas en compte de tels problèmes de calcul.
Matthieu
2
Le problème du minuteur 32 bits est valide, mais c'est un problème que les éditeurs de logiciels individuels doivent éviter soigneusement dans leur propre code. Windows n'est plus sujet aux défaillances liées à ce minuteur (comme c'était le cas auparavant), mais si vous avez installé un logiciel qui ne prend pas en compte la restauration du minuteur, cela peut avoir des effets inattendus.
tylerl
1
Faites-vous référence à cette base de connaissances Microsoft ?
Jscott
9
Euh, c’est un bug de NT 4 à gagner 2k + ne souffrez pas de cela. Je pense que nous pouvons affirmer en toute sécurité que NT 4 est mort en 2011. Et si quelqu'un le gère quelque part ... il mérite ce qu'il a à ce stade.
Zypher
2

J'avais l'habitude de redémarrer tous mes serveurs Windows chaque semaine et il y avait certainement un moment où cela était nécessaire. Ces jours-ci, je ne les redémarre que lorsqu'une mise à jour le requiert. Bien sûr, cela signifie qu’ils sont quand même redémarrés toutes les quelques semaines.

John Gardeniers
la source
2

Microsoft a beaucoup amélioré son système d'exploitation serveur au fil des ans. Et certains serveurs peuvent être exploités pendant 6 à 12 mois avant qu'ils ne commencent à rencontrer des problèmes, d'autres ne durent que 2 à 3 mois. Tout dépend des services et des applications exécutés par les serveurs. Mais ils auront tous un problème à un moment donné. Les mises à jour Windows, les fuites de mémoire, les logiciels imparfaits ne sont que quelques raisons.

Pour nos clients ayant des contrats de maintenance, nous installons des mises à jour et réinitialisons leurs serveurs tous les mois. Ces clients ont beaucoup moins de problèmes de serveur non planifiés, de l’ordre du 1/5, autant de problèmes que ceux qui ne redémarrent pas régulièrement.

Pour ceux qui affirment que le redémarrage provoque une défaillance prématurée du matériel, il était temps de redémarrer les disques durs et les systèmes. Cependant, les disques durs et autres composants actuels sont conçus pour supporter des milliers de cycles de démarrage et d'arrêt. Si le matériel de votre serveur est faible, préférez-vous le savoir à une heure contrôlée lorsque vous êtes sur place pour résoudre rapidement le problème, ou en cas d'échec aléatoire d'un appel au milieu de la journée ouvrable signalant une panne d'un département?

Je pense qu'il n'y a pas d'inconvénient aux redémarrages mensuels réguliers, alors que les avantages sont clairs et prouvés au fil du temps.

Todd H
la source
1

Je me fie aux mises à jour Windows pour configurer mon "programme de redémarrage". Laissez Windows se gérer .. pour une fois! Ce n'est que très rarement qu'un redémarrage est nécessaire avec notre configuration en raison de fuites de mémoire ...

louisnorthmore
la source
1

Je suis administrateur réseau dans une entreprise qui exploite plusieurs serveurs Windows 2003 2008. Je redémarre les serveurs sur une base mensuelle sans attendre plus de 3 mois, car il est très important d'être en panne pendant cette courte période.

Cependant, avec les correctifs et les mises à jour Windows, j'installe WSUS sur un contrôleur de domaine pour appliquer les mises à jour, etc., selon un calendrier adapté à mes préférences. Cela évite à tout serveur de se mettre à jour et de redémarrer de manière inattendue ...

GMitch
la source
1

Tous les Windows Haters devraient consulter les sites Netcraft.com avec les systèmes dont la durée de fonctionnement est la plus longue ( http://uptime.netcraft.com/up/today/top.avg.html ). Cela montre les sites qui ont fonctionné le plus longtemps depuis leur dernier redémarrage et 95% des 50 premiers ordinateurs sont Windows 2003 et 2000. Comme toujours, votre kilométrage peut varier.

Mark Lawrence
la source
Peut-être que vous n'en savez pas trop sur l'équilibrage de la charge ...
mercredi
0

Spécifier uniquement Windows peut être trop large pour prendre une décision raisonnable. En fait, vous prendrez une meilleure décision si vous considérez les services, rôles et fonctionnalités que vous exécutez sur la machine Windows (par exemple: services Web, serveurs de base de données, etc.).

La qualité et le comportement d'applications tierces et de services Web exécutés sur un serveur spécifique peuvent laisser supposer une demande de redémarrage plus / moins fréquent de la machine Windows hébergeant que les autres machines sans elles.

En fait, certaines applications tierces ( non conçues à la perfection; personne n’est parfait cependant! ) Risquent de ne pas libérer les ressources système acquises, telles que la mémoire, les verrous et les sockets, de manière élégante et rapide. Cela peut, par exemple, maintenir certains applications, services ou pilotes bloqués [, lorsqu’ils sont réexécutés] dans un état en attente ou en cours de démarrage qui pourrait ne pas être facilement réparés sans un redémarrage.

Dans la pratique, les applications gourmandes en disque, réseau et mémoire soumises à une charge de travail élevée et stressante et à des ressources système faibles peuvent rendre votre ordinateur Windows en retard, instable ou effondré, ce qui peut vous suggérer de les redémarrer plus tôt.

Si vous devez exécuter de telles applications défectueuses ou si vous devez desservir plus d'utilisateurs que la capacité habituelle de votre matériel / logiciel, ou si vous devez co-localiser des services incompatibles sur une seule machine physique, vous pouvez prendre une décision telle que vous devez redémarrer Windows. périodiquement. Dans ce cas, vous pouvez ajuster la période de redémarrage en écoutant les plaintes des utilisateurs concernant la vitesse du serveur!

FIV
la source
-6

La bonne réponse est jamais, sauf si vous faites une mise à niveau du logiciel. La dernière fois que j'ai redémarré mon serveur il y a environ 2 ans, il y avait une panne de courant.

Dmitriy R
la source
3
J'espère que vous parlez d'un serveur linux ou de votre serveur n'est pas utilisé à des fins professionnelles ...
HTDutchy
3
Chaque serveur corrigé doit être redémarré pour appliquer certains de ces correctifs. Tout serveur exposé à un réseau public doit être corrigé.
railmeat
J'ai quelques contrôleurs de domaine NT 4 qui sont démarrés environ une fois par an. Plus de mises à jour et non ciblées par les méchants beaucoup plus
maintenant