Parfois, j'ai des problèmes étranges pour démarrer mon ordinateur (qui exécute Debian). J'ai donc lancé la commande "dmesg". Dans sa sortie, j'ai vu beaucoup d'erreurs. Cependant, lorsque j'exécute le test SMART étendu sur les disques durs (à l'aide de la commande "smartctl -t long / dev / sda"), le résultat est que mes disques ne sont pas cassés.
Quelle peut être la raison de ces erreurs?
Voici les erreurs:
(...)
[ 505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen
[ 505.918549] ata3.00: irq_stat 0x08000000, interface fatal error
[ 505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 505.918566] ata3.00: failed command: READ FPDMA QUEUED
[ 505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in
res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error)
[ 505.918586] ata3.00: status: { DRDY }
[ 505.918595] ata3: hard resetting link
[ 506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 506.422648] ata3.00: configured for UDMA/133
[ 506.422679] ata3: EH complete
[ 1633.123880] md: bind<sdb3>
[ 1633.187966] RAID1 conf printout:
[ 1633.187977] --- wd:1 rd:2
[ 1633.187984] disk 0, wo:0, o:1, dev:sda3
[ 1633.187989] disk 1, wo:1, o:1, dev:sdb3
[ 1633.188866] md: recovery of RAID array md0
[ 1633.188871] md: minimum _guaranteed_ speed: 1000 KB/sec/disk.
[ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
[ 1633.188890] md: using 128k window, over a total of 1943618560k.
[ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen
[ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167389] ata3.00: status: { DRDY }
[ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167413] ata3.00: status: { DRDY }
[ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167435] ata3.00: status: { DRDY }
[ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167457] ata3.00: status: { DRDY }
[ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167479] ata3.00: status: { DRDY }
[ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167500] ata3.00: status: { DRDY }
[ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167522] ata3.00: status: { DRDY }
[ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167544] ata3.00: status: { DRDY }
[ 1634.167553] ata3: hard resetting link
[ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1634.672645] ata3.00: configured for UDMA/133
[ 1634.672696] ata3: EH complete
[ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen
[ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687947] ata3.00: status: { DRDY }
[ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687971] ata3.00: status: { DRDY }
[ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687993] ata3.00: status: { DRDY }
[ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688015] ata3.00: status: { DRDY }
[ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688037] ata3.00: status: { DRDY }
[ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688059] ata3.00: status: { DRDY }
[ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688081] ata3.00: status: { DRDY }
[ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688102] ata3.00: status: { DRDY }
[ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688124] ata3.00: status: { DRDY }
[ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688146] ata3.00: status: { DRDY }
[ 1637.688154] ata3: hard resetting link
[ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1638.192977] ata3.00: configured for UDMA/133
[ 1638.193029] ata3: EH complete
[ 1640.259492] md: export_rdev(sdb1)
[ 1640.326109] md: bind<sdb1>
[ 1640.346712] RAID1 conf printout:
[ 1640.346724] --- wd:1 rd:2
[ 1640.346731] disk 0, wo:0, o:1, dev:sda1
[ 1640.346736] disk 1, wo:1, o:1, dev:sdb1
[ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units)
[ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen
[ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED
[ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in
res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error)
[ 1657.988013] ata3.00: status: { DRDY }
[ 1657.988022] ata3: hard resetting link
[ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1658.493107] ata3.00: configured for UDMA/133
[ 1658.493147] ata3: EH complete
[ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps
[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547869] ata3.00: status: { DRDY }
[ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547892] ata3.00: status: { DRDY }
[ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547913] ata3.00: status: { DRDY }
[ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547935] ata3.00: status: { DRDY }
[ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547957] ata3.00: status: { DRDY }
[ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547978] ata3.00: status: { DRDY }
[ 1670.547987] ata3: hard resetting link
[ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[ 1671.053386] ata3.00: configured for UDMA/133
[ 1671.053444] ata3: EH complete
[ 2422.512002] md: md0: recovery done.
[ 2422.547344] md: recovery of RAID array md1
[ 2422.547355] md: minimum _guaranteed_ speed: 1000 KB/sec/disk.
[ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
[ 2422.547378] md: using 128k window, over a total of 4877312k.
[ 2422.668465] RAID1 conf printout:
[ 2422.668474] --- wd:2 rd:2
[ 2422.668480] disk 0, wo:0, o:1, dev:sda3
[ 2422.668486] disk 1, wo:0, o:1, dev:sdb3
[ 2469.990451] md: md1: recovery done.
[ 2470.049986] RAID1 conf printout:
[ 2470.049997] --- wd:2 rd:2
[ 2470.050003] disk 0, wo:0, o:1, dev:sda1
[ 2470.050009] disk 1, wo:0, o:1, dev:sdb1
[ 3304.445149] PM: Hibernation mode set to 'platform'
[ 3304.782375] PM: Syncing filesystems ... done.
[ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done.
(...)
Réponses:
Tout d'abord, gardez à l'esprit que SMART disant que votre lecteur est en bonne santé ne signifie pas nécessairement que le lecteur est en bonne santé. Les rapports SMART sont une aide , pas une vérité absolue.
Si tout ce qui vous intéresse, c'est quoi faire, plutôt que pourquoi, alors n'hésitez pas à faire défiler les derniers paragraphes; cependant, le texte intérimaire vous expliquera pourquoi je pense que ce que je propose est la bonne marche à suivre et comment tirer cela de ce que vous avez publié.
Cela dit, regardons ce que l'une de ces erreurs nous dit.
(J'espère avoir obtenu les pièces qui devraient aller de pair, mais vous en obteniez un ensemble, donc ça devrait aller dans les deux cas.)
Le Wiki Linux ata a une page expliquant comment lire ces erreurs . Particulièrement,
status
valeur deDRDY
signifie "Appareil prêt. Normalement 1, quand tout est OK." Voir une valeur d'état deDRDY
est parfaitement normal et attendu.SError
a plusieurs valeurs de composants, dont vous voyez (dans cet extrait en particulier):UnrecovData
"Une erreur d'intégrité des données s'est produite, l'interface n'a pas récupéré"HostInt
"Erreur interne de l'adaptateur de bus hôte"10B8B
"Une erreur de décodage de 10b à 8b s'est produite"BadCRC
"Une erreur CRC de couche de liaison s'est produite"Le codage 10b8b, qui code 8 bits en 10 bits pour faciliter la synchronisation du signal et la détection des erreurs, est utilisé sur le câblage physique, pas nécessairement sur le lecteur lui-même. Le lecteur utilise probablement d'autres formes de codage FEC ou ECC, et une erreur y apparaîtrait normalement comme une forme d'erreur d'E / S, probablement avec une
error
valeur deUNC
("erreur non corrigible - souvent due à de mauvais secteurs sur le disque") , probablement avec "erreur de support" ("le logiciel a détecté une erreur de support") entre parenthèses à la fin de lares
ligne. Ce dernier n'est pas ce que vous voyez, alors même si nous ne pouvons pas l'exclure complètement, cela semble peu probable.La « couche de liaison » est les câbles physiques et des traces de carte de circuit imprimé entre propre contrôleur du lecteur et la puce d'interface de lecteur de disque (probablement partie du southbridge sur la carte mère de votre ordinateur, mais il pourrait être situé à un adaptateur de bus hôte offboard).
Un adaptateur de bus hôte, également appelé HBA, est le circuit qui se connecte à l'équipement de stockage. Aussi connu sous le nom de "contrôleur de disque", un terme qui est un peu impropre aux systèmes modernes. La partie la plus visible du HBA est généralement les ports de connexion, le plus souvent de nos jours soit SATA ou un facteur de forme SAS.
Les drapeaux
UnrecovData
etHostInt
nous indiquent essentiellement que "quelque chose s'est tout simplement mal passé, et il n'y avait aucun moyen de récupérer ou aucune tentative de récupération n'a été faite". L'inverse serait probablementRecovData
, ce qui indique qu'une "erreur d'intégrité des données s'est produite, mais l'interface s'est rétablie". (En passant, j'aurais probablement utiliséHBAInt
au lieu deHostInt
, car "l'hôte" se réfère au HBA, pas à l'ensemble du système.)La combinaison de
10B8B
etBadCRC
, qui pointent tous deux vers la couche de liaison physique, me fait suspecter un problème de câblage.Cette suspicion est également étayée par le fait que les autotests SMART, qui sont complètement internes au lecteur, à l'exception des rapports d'état, ne trouvent aucune erreur que le fabricant juge suffisamment sérieuse pour justifier un rapport dans les résultats. Si le lecteur avait des problèmes pour stocker ou lire des données, le long autotest SMART en particulier aurait dû le signaler.
TL; DR:
La première chose que je ferais est donc simplement de débrancher et rebrancher le câble SATA aux deux extrémités; il peut être légèrement desserré, ce qui lui fait perdre le contact électrique par intermittence. Voyez si cela résout le problème. Cela peut même valoir la peine de le faire pour tous les câbles SATA de votre ordinateur, pas seulement pour le disque affecté. Si vous utilisez un HBA hors carte, je voudrais également retirer et réinstaller cette carte, principalement parce que c'est une chose facile à essayer pendant que vous êtes déjà en train de jouer avec le câblage.
À défaut, essayez de jeter et de remplacer le câble SATA, de préférence par un câble de haute qualité. Un câble de haute qualité sera légèrement plus cher, mais je trouve qu'il vaut généralement bien les petites dépenses supplémentaires s'il permet d'éviter des maux de tête comme celui-ci. Personne n'aime voir ses erreurs de crachat de stockage!
la source
Dans mon cas, j'ai remarqué que j'avais branché deux disques sur deux contrôleurs de disque différents: le premier était PCI-Express et le second PCI normal. Je me suis débarrassé de l'erreur BadCRC lorsque j'ai branché les deux disques RAID sur le même contrôleur.
la source