RAID resynchronisation automatiquement?

11

J'ai plutôt vérifié au hasard le statut de mes matrices RAID avec cat/proc/mdstatet réalisé que l'une de mes matrices semble resynchroniser:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Pourquoi est-ce et qu'est-ce que cela signifie? Apparemment, je peux très bien accéder au point de montage avec des r/wautorisations.

EDIT 1 (en réponse à la RÉPONSE DE SLM )

Je ne peux pas vraiment voir quoi que ce soit si je passe à greptravers dmesget le --detailcommutateur ne me dit pas grand-chose non plus, c'est-à-dire qu'il affiche que la resynchronisation est en cours ... mais aucune indication sur la raison ou la raison pour laquelle il aurait pu se désynchroniser .. . - Je suppose que je devrais peut-être simplement garder un œil dessus avant de commencer à échanger mon matériel.

stdcerr
la source

Réponses:

10

Cela semblerait indiquer que la synchronisation entre les 2 membres du RAID ne reste pas synchronisée.

1. Enquêter sur les journaux

J'examinerais vos dmesgjournaux et verrais s'il y a des messages indiquant que l'un des disques durs physiques qui composent cette baie a des pannes matérielles.

2. Vérifiez mdadm

Vous pouvez également consulter en mdadmutilisant le --detailcommutateur pour en savoir plus d'informations sur la resynchronisation comme ceci:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Si les deux appareils semblent corrects et que vous ne pouvez pas identifier l'appareil qui a un problème, vous pouvez exécuter temporairement un outil de diagnostic tel que HDAT2 ou SpinRite sur chaque disque dur pour confirmer leur état de santé.

3. Câblage

Si les disques durs vérifient, je commence à examiner le câblage, je les échange généralement.

4. Contrôleur

J'examinerais ensuite le contrôleur lui-même, soit en retirant les disques du système affecté et en les diagnostiquant dans un système secondaire, soit en ajoutant une carte contrôleur tierce dans le système affecté pour diagnostiquer le problème plus en détail.

5. Alimentation

Croyez-le ou non, j'ai eu des problèmes dans le passé avec les disques durs et les RAID où le remplacement d'une alimentation défectueuse ou sur le point de défaillir a résolu mes problèmes de santé du RAID.

slm
la source
@cerr - ouais si les resynchronisations continuent juste à se produire à ce qui semble être des intervalles aléatoires, alors il est probable que l'un des disques durs soit sur le point de sortir, ou 3,4, ou 5. La manifestation que vous décrivez plusieurs fois moi-même et ce sont ces situations qui ont résolu ces échecs, pour moi, dans le passé.
slm
8

Vérifiez vos fichiers cron, de nombreuses distributions font une resynchronisation / re-vérification planifiée une fois par semaine.

Sur CentOS 7.1, c'est dans /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Pour configurer le comportement, éditez / etc / sysconfig / raid-check

Sergio
la source
Bien que ce ne soit généralement qu'un chèque, pas une resynchronisation ...
frostschutz
2
@frostschutz ... sauf si c'est le premier dimanche d'un mois: serverfault.com/a/255549/299551 Dans ce cas, une resynchronisation est forcée.
Dan
2

Sur Debian, cela se fait à partir de:

/etc/cron.d/mdadm

Pour désactiver:

chmod -x /usr/share/mdadm/checkarray

Voir également.

sanmai
la source