Erreur EXT4-fs après la mise à niveau d'Ubuntu 17.04

18

J'ai un Dell XPS 15 9550 . J'utilise Ubuntu 16.10 depuis quatre mois sans drames.

Il y a deux jours, je suis passé à Ubuntu 17.04 . Environ une heure après la mise à niveau, mon disque dur est remonté en mode lecture seule. Lorsque je suis passé à un écran tty, cela est apparu:

[ 746.341551] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #525023: comm NetworkManager: reading directory iblock 0
[ 746.343318] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524289: comm pool: reading directory iblock 0
[ 746.356125] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272213: comm systemd-udevd: reading directory iblock 0
[ 746.356139] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.356332] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272193: comm systemd-udevd: reading directory iblock 0
[ 746.356338] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272825: comm systemd-udevd: reading directory iblock 0
[ 746.356400] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.474632] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524539: comm unity-settings-: reading directory iblock 0
[ 746.992814] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506108: comm BrowserBlocking: reading directory iblock 0
[ 746.304451] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506117: comm BrowserBlocking: reading directory iblock 0

Voici ce que fdisk -lmontre:

Disk /dev/nvme0n1: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3CD27380-DAC8-48DC-910A-D084CE857DA3

Device             Start        End   Sectors   Size Type
/dev/nvme0n1p1      2048    1026047   1024000   500M EFI System
/dev/nvme0n1p2   1026048    1288191    262144   128M Microsoft reserved
/dev/nvme0n1p3   1288192  487948287 486660096 232.1G Microsoft basic data
/dev/nvme0n1p4 972302336  973223935    921600   450M Windows recovery environmen
/dev/nvme0n1p5 973223936  998094847  24870912  11.9G Windows recovery environmen
/dev/nvme0n1p6 998094848 1000204287   2109440     1G Windows recovery environmen
/dev/nvme0n1p7 487948288  939046911 451098624 215.1G Linux filesystem
/dev/nvme0n1p8 939046912  972302335  33255424  15.9G Linux swap

Partition table entries are not in disk order.

J'ai redémarré et j'ai continué à contourner l'erreur une fois par heure. J'ai donc réinstallé Ubuntu 17.04 à partir de zéro . Cependant, je reçois toujours le même problème.

J'ai essayé d'exécuter fsck en créant un fichier / forcefsck (j'ai créé un script shell wrapper qui ajoute l' -vindicateur et génère stdout dans un fichier). Voici le résultat:

fsck.fat 4.0 (2016-05-06)                               
Checking we can access the last sector of the filesystem
Boot sector contents:                                   
System ID "MSDOS5.0"                                    
Media byte 0xf8 (hard disk)                             
       512 bytes per logical sector                     
      4096 bytes per cluster                            
      6206 reserved sectors                             
First FAT starts at byte 3177472 (sector 6206)          
         2 FATs, 32 bit entries                         
    508416 bytes per FAT (= 993 sectors)                
Root directory start at cluster 2 (arbitrary size)      
Data area starts at byte 4194304 (sector 8192)          
    126976 data clusters (520093696 bytes)              
63 sectors/track, 255 heads                             
      2048 hidden sectors                               
   1024000 sectors total                                
Reclaiming unconnected clusters.                        
Checking free cluster summary.                          
/dev/nvme0n1p1: 212 files, 15526/126976 clusters    

J'ai essayé de démarrer à partir d'une clé USB en direct et de courir e2fsck -p /dev/nvme0n1p7comme suggéré ici ( /ubuntu//a/768813/679041 ). Cela n'a donné aucune erreur.

J'ai également essayé de lancer, smartctl -t long /dev/nvme0n1p7mais les résultats semblent indiquer que l'outil ne fonctionne pas avec mon SSD particulier:

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.10.0-19-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       PM951 NVMe SAMSUNG 512GB
Serial Number:                      S29PNX0H611013
Firmware Version:                   BXV77D0Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            254,982,533,120 [254 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Apr 17 17:45:48 2017 AEST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x2002

Avez-vous une idée de la raison pour laquelle ce problème peut se produire et comment je pourrais le résoudre? Merci! :)

Ben B
la source
1
Bienvenue sur AskUbuntu! Il semblerait que vous puissiez être affecté par ce bogue. Je vous recommande de faire savoir aux développeurs que ce bogue vous affecte également et de vous abonner au bogue afin de pouvoir être informé de la progression / résolution.
Elder Geek
J'ai exactement le même problème sur un Lenovo Thinkpad X270 avec un SSD Toshiba "THNSF5256GPUK TOSHIBA". Je suppose que c'est bon de savoir que je ne suis pas le seul.
Maeher
@ElderGeek en lisant le rapport de bogue lié, il semble que jusqu'à ce que le problème soit résolu, un correctif temporaire serait de désactiver APST, mais d'après la discussion, il n'est pas clair pour moi comment le faire. Il semble qu'un moyen de le faire serait une réponse valable à cette question.
Maeher
Merci pour vos commentaires gars :) Impatient, je réinstallées à nouveau hier soir, mais cette fois je explicitement mis en forme / dev / nvme0n1p7 et Deleted / dev / nvme0n1p8 avance (je pensais que peut - être une réinstallation avec toutes les options par défaut pourrait pas le format réellement, et au lieu ne supprimez que les anciens fichiers avant d'en installer de nouveaux). Je n'ai pas encore rencontré le problème après 4 heures d'utilisation ininterrompue, mais seul le temps nous le dira. Vous entendrez mes sanglots à travers le Pacifique si je le fais :)
Ben B
OK, je peux confirmer - je viens de récupérer le problème malgré le formatage complet de la partition. Ajoutera un commentaire au bug lié ci
Ben B

Réponses:

19

Comme indiqué dans un commentaire d'Elder Geek , cela est dû à un bug connu .

Du rapport de bogue:

Le support APST vient d'arriver dans le dernier noyau Zesty (4.10.0-14.16) dans le cadre de https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1664602 . Ce correctif a une particularité pour certains disques Samsung de 256 Go trouvés dans les ordinateurs portables Dell qui ne se comportent pas bien lorsque APST est activé. Je rencontre les mêmes symptômes avec le même modèle d'ordinateur portable qu'avec un Samsung de 512 Go. Avant de désactiver manuellement APST, le lecteur mourrait et le système tomberait en flammes avec des erreurs d'E / S dans les 20 à 40 minutes suivant le démarrage.

Jusqu'à ce qu'un correctif correct soit implémenté, une solution de contournement est suggérée, qui consiste à ajouter un paramètre de noyau :

Veuillez essayer nvme_core.default_ps_max_latency_us=5500, si le problème persiste, essayez nvme_core.default_ps_max_latency_us=200.

Pour ajouter un paramètre de démarrage du noyau, modifiez le fichier de configuration de GRUB:

sudo nano /etc/default/grub

Recherchez le début de la ligne GRUB_CMDLINE_LINUX_DEFAULTet ajoutez le paramètre de démarrage aux autres déjà entre les guillemets. Par exemple, dans ce cas, vous vous retrouverez probablement avec

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=5500"

Enregistrez le fichier et quittez, puis pour que la modification soit effective, exécutez

sudo update-grub 
Ben B
la source
1
Ce correctif fonctionne-t-il pour vous? BTW un lien sur la façon de définir les paramètres du noyau pour savoir qui pourrait tomber sur votre réponse wiki.ubuntu.com/Kernel/KernelBootParameters
justmyfault
1
J'utilise Ubuntu 16.04 et j'ai mis à jour les paquets par morceaux vers zesty, quelque chose que je ne recommanderais à personne que de faire par nécessité. Le dernier paquet était libc, quelque chose de tellement intégré au système que si quelque chose tournait mal, ce serait lors de la mise à niveau de libc. Au redémarrage, j'ai vu toutes les erreurs EXT4 mentionnées dans la question ci-dessus, mais l'ajout du paramètre du noyau m'a finalement permis de redémarrer en paix et de continuer. Je vous remercie.
lukecampbell
des mises à jour à ce sujet? Je souffre de ce problème sur mon razer blade furtif avec un samsung 512gb ssd
Lucas Zanella
La solution ci-dessus a fonctionné pour moi, mais le bogue a été corrigé dans le paquet linux - 4.10.0-22.24. Si vous rencontrez toujours des problèmes, vous devez ouvrir un nouveau rapport de bogue sur le tableau de bord.
Ben B
J'ai essayé les deux valeurs, mais cela s'est quand même écrasé. nvme_core.default_ps_max_latency_us = 0 a fonctionné pour moi. Noyau 4.15.0-36-générique Ubuntu 16.04
Mike Schroll
0

Tout d'abord, je visiterais le site Web de support de Samsung et m'assurerais que le dernier firmware est installé pour votre modèle de SSD.

Ensuite, votre fsck n'avait pas beaucoup de sens, alors faites-le de cette façon ...

Pour vérifier le système de fichiers sur votre partition Ubuntu ...

  • démarrer dans le menu GRUB
  • choisissez Options avancées
  • choisissez le mode de récupération
  • choisissez l'accès root
  • à l'invite #, saisissez sudo fsck -f /
  • répétez la commande fsck en cas d'erreurs
  • type reboot
heynnema
la source
1
Merci pour votre réponse! J'ai réinstallé, mais cette fois j'ai formaté explicitement la partition problématique en premier (au cas où le processus de réinstallation par défaut n'aurait pas réellement formaté). Si tout va bien maintenant, cependant, si le problème persiste, je lancerai un fsck et publierai les résultats (bien que je dirais que si le problème persiste sur une partition fraîchement formatée, cela pourrait dépasser les capacités de fsck)
Ben B
Le problème s'est produit à nouveau, mais comme l'a souligné Elder Geek dans les commentaires ci-dessous ma question, il semble être dû à un bogue connu ( bugs.launchpad.net/ubuntu/+source/linux/+bug/1678184 ).
Ben B
@BenB avez-vous déjà vérifié le firmware de votre SSD Samsung, comme je l'avais suggéré plus tôt? Selon le modèle, ils avaient des mises à jour très obligatoires pour que le lecteur fonctionne correctement.
heynnema
Je ne suis pas sûr à 100% de savoir comment procéder. J'ai trouvé un micrologiciel ici, mais je ne suis pas sûr à 100% que ceux-ci s'appliquent à mon SSD particulier. Le rapport de bogue ne pointe de toute façon aucun problème lié au firmware, donc à ce stade, je préfère attendre plus d'informations des développeurs qui s'attaquent au bug avant d'essayer de mettre à jour le firmware (en me connaissant, je le ferais mal et perdre toutes mes affaires: P).
Ben B
1
fsck ne montre aucune erreur. Le problème n'est pas une sorte de problème de micrologiciel ou de corruption de SSD. Cela est dû à APST, qui a été activé en 17.04. La définition du paramètre du noyau 'nvme_core.default_ps_max_latency_us = 5500' a résolu le problème pour moi, et d'autres ont signalé que la désactivation d'APST le résolvait complètement pour eux.
Ben B
0

Une solution de contournement possible au bogue connu que j'ai mentionné et que je ne peux pas tester car je n'ai pas le matériel NVMe en question serait d'essayer de démarrer le package de construction de noyau quotidien principal pour votre archétecture disponible ici.

Attendez! avant de vous lancer pour essayer cela, je dois souligner qu'à moins que vous ne soyez certain de savoir exactement ce que vous faites et comment récupérer des conséquences imprévues, il est fortement recommandé de sauvegarder.

Si vous ne savez pas ce que vous faites et avez une sauvegarde actuelle, vous pouvez trouver plus d'informations sur la construction de votre noyau ici.

Remarque: Au cas où vous auriez survolé la première phrase, cette réponse est basée sur des recherches, pas sur des tests. S'il tombe en panne, restaurez votre sauvegarde.

Elder Geek
la source