Je me demandais si c'était une bonne idée de remplacer un disque dur dans un serveur de base de données (assez) critique du système après un certain nombre d'années d'utilisation, avant qu'il ne meure.
Par exemple, je pensais à remplacer un disque dur après 3 ans d'utilisation. Étant donné que j'ai plusieurs disques durs sur plusieurs serveurs, je pourrais échelonner quels disques durs sont remplacés.
Est-ce une bonne idée ou les gens attendent-ils simplement l'échec?
la source
Non.
L'un des plus gros problèmes liés au remplacement d'un disque dur sur un serveur de production actif est que cela entraînera une reconstruction. Surtout si vous utilisez RAID5, et surtout si vous utilisez de gros disques, forcer une reconstruction crée un risque très important de défaillance irrécupérable. Le risque de perdre la baie lors d'une reconstruction est bien plus important que le risque de laisser en place un disque dur de 3 ans.
En prenant un exemple extrême, si vous remplacez successivement chaque disque dans une matrice RAID5 à 6 disques composée de disques de 2 To, votre risque théorique d'une erreur de lecture irrécupérable lors de l'une des reconstructions est de l'ordre de 58% (selon mes calculs sur la serviette; veuillez faire vos propres et comparer les notes). En d'autres termes: votre remplacement de disque "préventif" n'est, en effet, rien de moins qu'un acte de sabotage.
La seule fois où j'envisagerais de rafraîchir des disques sur un ancien serveur serait au cours de sa "remise à neuf", par exemple après avoir été mis hors service d'une tâche et avant de le remettre en service avec un nouveau rôle. Même à ce stade, les exigences de capacité et de performances seraient bien plus importantes que l'âge des disques.
la source
Je ne l'ai pas vu. Nous gardons les serveurs sous garantie jusqu'à leur mise hors service - 5 ans. Le RAID 5 standard vous permet de survivre à une panne de disque, nous gardons donc quelques disques à portée de main afin de pouvoir commencer une reconstruction immédiatement et sur les serveurs critiques, nous incluons un disque de rechange ou passez au RAID 10.
Si vous avez remarqué que plusieurs disques tombent en panne récemment sur un serveur, vous pouvez avoir un problème de fond de panier. Il pourrait également y avoir de nouvelles vibrations ou de la poussière provenant de la construction à proximité.
la source