Pour fsck ou non fsck après 180 jours

18

Par défaut, après 180 jours ou un certain nombre de montages, la plupart des systèmes de fichiers Linux forcent une vérification du système de fichiers (fsck). Bien sûr, cela peut être désactivé en utilisant, par exemple, tune2fs -c 0 -i 0 sur ext2 ou ext3.

Sur les petits systèmes de fichiers, cette vérification n'est qu'un inconvénient. Cependant, étant donné les systèmes de fichiers plus volumineux, cette vérification peut prendre des heures et des heures. Lorsque vos utilisateurs dépendent de ce système de fichiers pour leur productivité, disons qu'il sert leurs répertoires personnels via NFS, désactiveriez-vous la vérification planifiée du système de fichiers?

Je pose cette question car il est actuellement 2h15 et j'attends un très long fsck à terminer (ext3)!

Michael Havas
la source

Réponses:

13

Le délai fsck par défaut de 180 jours est une solution de contournement pour la faille de conception qui ext3 ne prend pas en charge une vérification de cohérence en ligne. La vraie solution est de trouver un système de fichiers qui le supporte. Je ne sais pas si un système de fichiers mature le fait. C'est une vraie tragédie. Peut-être que btrfs nous sauvera un jour.

J'ai répondu au problème de l'indisponibilité surprise de plusieurs heures de fsck en effectuant des redémarrages planifiés avec un fsck complet dans le cadre de la maintenance standard. C'est mieux que de rencontrer une corruption mineure pendant les heures de production et de la transformer en une véritable panne.

Une grande partie du problème est que ext3 a un fsck déraisonnablement lent. Bien que xfs ait un fsck beaucoup plus rapide, il utilise trop de mémoire pour les distributions pour encourager xfs par défaut sur les gros systèmes de fichiers. Pourtant, sur la plupart des systèmes, ce n'est pas un problème. Le passage à xfs permettrait au moins un fsck assez rapide. Cela peut faciliter l'exécution de fsck dans le cadre de la maintenance normale.

Si vous exécutez RedHat et envisagez d'utiliser xfs, vous devez faire attention à la façon dont ils découragent fortement l'utilisation de xfs et au fait qu'il y a probablement peu de personnes utilisant xfs sur le noyau que vous utilisez.

Ma compréhension est que le projet ext4 a pour objectif d'améliorer au moins quelque peu les performances de fsck.

carlito
la source
"Passer à xfs permettrait au moins un fsck assez rapide" ... Ai-je raté quelque chose ?
Justin ᚅᚔᚈᚄᚒᚔ
4

Je dirais que c'est juste une autre raison pour laquelle les serveurs de production ne devraient pas fonctionner seuls et toujours avoir une sauvegarde à chaud / à froid ou participer à un cluster à deux nœuds. En ces jours de virtualisation, vous pouvez facilement avoir un serveur principal physique et un serveur virtuel, qui n'est qu'une copie du physique fait tous les X jours, prêts à prendre le relais.

Autre que cette réponse pas si utile, je dirais que vous devriez équilibrer l'importance de vos données ... S'il ne s'agit que d'un nœud de cluster, sautez-le. S'il s'agit du serveur Web non sauvegardé d'un client, vous voudrez peut-être planifier à l'avance la prochaine fois :-)

Antoine Benkemoun
la source
3

Cela dépend. Par exemple, nous avons eu un serveur en panne pour la maintenance de routine qui exécutait une pile QMail. QMail crée et tue beaucoup de fichiers au fil du temps, et c'était un serveur de messagerie très occupé. Le fsck a pris environ 36 heures. Ce n'est pas comme si nous avions sauvé beaucoup de performances de l'entente, mais en fin de compte, je suppose que vous pourriez affirmer que le système de fichiers était plus sain. Cela valait-il vraiment le chaos qui s'en est suivi? Ne pas. À. Tout.

f4nt
la source
4
En outre, je suis sûr que vous le savez également, mais l'arrêt -f contournera fsck au redémarrage.
Artem Russakovskii
Ouais, le 20/20 du recul comme ça hein? :)
f4nt
0

XFS est intéressant. C'est un FS toujours cohérent. Il n'a pas besoin de fsck. Cela ne causera pas de temps d'arrêt en raison de fsck.

Mais il a un autre problème. Vous avez besoin d'un contrôleur RAID prenant en charge la gestion des blocs défectueux du disque dur.

XFS n'a pas la possibilité de mettre sur liste noire les blocs défectueux lorsque le système d'exploitation commence à connaître les blocs défectueux et que la liste des blocs défectueux du disque dur est pleine.

ext2 / 3/4, fat, ntfs, etc (test hors ligne) sont en mesure de blacklister les mauvais blocs mais pas XFS.

Ainsi, pour les installations non destinées aux entreprises, XFS ne convient probablement pas bien. J'utilise XFS avec le logiciel linux raid1 pour les partitions de sauvegarde où le contenu est beaucoup de petits fichiers avec peu de changement au fil du temps.

Jose Tavares
la source