Nous avons un partage NFS 4, partageant un volume entre un certain nombre de serveurs (serveur NFS et clients tous Debian 8). Nous avons récemment rencontré des problèmes où des pannes de réseau gèlaient les systèmes clients.
Options Notre NFS étaient minimes, juste rw
(et donc les valeurs par défaut hard
, fg
etc.).
J'expérimente maintenant avec ces options, mais je n'obtiens pas le comportement que j'attends:
rw,soft,bg,retrans=6,timeo=150
(J'ai augmenté les retransmissions pour compenser une partie du risque faible)
La procédure que je suis en train de tester est:
- Machine de démarrage
cd
à/mnt/mountpoint
- Vérifiez la connexion NFS ok
cd /
- tuer le réseau
ifdown eth0
cd
à/mnt/mountpoint
ls
À ce stade, la ligne de commande se bloque et je ne peux pas l'interrompre. Après un certain temps, le message «nfs: serveur [nom_serveur] ne répond pas, a expiré», qui semble se répéter une fois par minute (indéfiniment).
Ce que j'aimerais / m'attends à ce que l'opération échoue et que je revienne au contrôle.
S'il vous plaît quelqu'un pourrait-il me dire où je me trompe avec ces paramètres?
(PS: j'ai également essayé de monter avec des autofs, mais j'ai vu un comportement similaire)
Je vous remercie
soft
en aucun cas. Il permet d' éliminer les données en cas d'erreur . Au lieu de cela, je suggèrehard,intr
.hard
est tout aussi mauvaise pour nous (les systèmes meurent et restent morts jusqu'au redémarrage).intr
n'est pas pris en charge dans NFS4 selon l'homme.intr
cela soit pris en charge par NFS4, mais pas par les noyaux> 2.6.25)cd
, mais à la placels /mnt/mountpoint
? Il est possible qu'après l'ls
échec, votre shell tente d'effectuer des opérations sur le système de fichiers dépendant de PWD. (Pire encore, si vous avez été assez idiot pour mettre.
votre$PATH
)Réponses:
intr
devrait vous permettre de reprendre le contrôle lorsque vous frappez^C
, mais généralement pas immédiatement.Comme vous le dites, les attentes sont le problème ici. Les problèmes de réseau peuvent être temporaires, mais l'échec d'une opération est permanent. Par conséquent, la plupart des opérations par défaut sont simplement bloquées jusqu'à la fin de l'opération.
Ceci est la réponse standard, mais en regardant une page de manuel actuelle, je vois ceci:
Donc, il ne me semble pas que ce soit un problème NFS3 / NFS4, mais une décision sur le
intr
fonctionnement. Vous devriez donc pouvoir suivreKILL
le processus, mais cela ne vous donnera peut-être pas beaucoup d'utilité.Je n'ai pas pu trouver la discussion sur la raison pour laquelle l'option a été supprimée. Pouvez-vous tuer -KILL votre processus?
la source
intr
est pris en charge par nfs 2/3 mais pas 4.Une partie de ma réponse est une opinion, basée sur l'expérience. Là où j'ai des faits, je vais (essayer de m'en souvenir) les relier.
soft
dans presque aucune circonstance. Il permet d' éliminer les données en cas d'erreur . Au lieu de cela, je suggèrehard,intr
.intr
n'est pas valable pour NFS 4, mais il semble que ce soit un changement de noyau plutôt qu'un changement NFS.autofs
) fonctionne bien pour mes cas d'utilisation avec les versions NFS 2 et 3, et parvient à protéger mes systèmes clients contre les pannes de serveur en montant les systèmes de fichiers NFS uniquement lorsqu'ils sont requis.Ma suggestion serait d'envisager de passer de NFS 4 à NFS 3 et de voir si cela aide votre cas d'utilisation particulier. Ne le considérez pas comme un déclassement.
la source
intr
n'est pas pris en charge sur les versions récentes du noyau.intr
est pris en charge dans NFS4 (il est répertorié dans les deux seules options 2/3 et les 4 seules options dans man, ce qui est un peu déroutant), mais tout simplement pas pris en charge dans les versions récentes du noyau.hard
, tout le site Web tombe en panne. Si nous utilisonssoft
, nous pourrions éventuellement obtenir quelques images cassées (bien que notre système de mise en cache atténue cela presque complètement). Le risque d'soft
autoriser la corruption de fichiers n'est pas vraiment un gros problème. Je préfère de loin avoir un fichier image corrompu qu'un site en panne!soft
une solution acceptable. Réponse modifiée de "jamais" à "presque jamais". Merci!