Toujours peur: les erreurs de demande d'abandon de l'adaptateur à l'hôte après avoir suivi les étapes recommandées

9

J'obtiens l'infâme aacraid: erreur de demande d'abandon de l'adaptateur à l'hôte avec mon nouveau contrôleur RAID Adaptec sous des E / S élevées. J'ai lu plusieurs forums, même Adaptecs , qui définissant la valeur / sys / block / sdX / device / timeout à 45 résoudra ce problème. Cependant, j'utilise Ubuntu Server 12.04 qui a déjà cette valeur à 45 par défaut. J'ai également essayé la suggestion suivante qui consistait à mettre à jour le bios de mon mobo au plus tard, ce que j'ai fait.

Je ne sais pas si quelqu'un d'autre a rencontré cette erreur "aacraid: Host adapter abort request" avant même après avoir suivi ces étapes.

Voici ce que je vois dans mon syslog:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Heres my uname -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Merci a tous,

Jim

Jim
la source

Réponses:

1

Au cas où vous ne l'auriez pas encore résolu, j'ai récemment lutté avec le même problème qui s'est rapidement transformé en tableau suspendu toutes les 5 minutes pendant quelques minutes à mesure que l'IO augmentait. Ubuntu utilise par défaut le planificateur CFQ qui n'est pas optimal pour le RAID matériel. Basculez le planificateur sur noop avec:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Personnellement, je suis coincé avec l'ancien noyau, mais on m'a dit que la mise à niveau vers le dernier pilote aacraid devrait résoudre le problème - je ne peux pas vérifier cela cependant. Mais même ainsi, passez à noop. Étant donné que sysfs n'est pas permanent, vous souhaiterez peut-être définir le planificateur dans /etc/rc.localou utiliser le elevator=paramètre de démarrage.

Je ferais attention aux autres paramètres du noyau, ainsi que les paramètres sur Ubuntu sont des valeurs par défaut raisonnables pour la plupart des matériels, mais la plupart du temps, les serveurs nécessitent une attention particulière quelle que soit la distribution sur laquelle vous vous trouvez.

Kev
la source
1

Si votre contrôleur RAID Adaptec possède son propre firmware / BIOS, vous devrez peut-être le mettre à jour. Nous avons eu des problèmes lors des E / S élevées et nous avons également obtenu «aacraid: requête d'abandon de l'adaptateur à l'hôte» et nous avons vu une version du micrologiciel plus récente que la version actuelle qui disait «Correction d'un problème où le micrologiciel pouvait se bloquer pendant une tension d'E / S élevée». http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

Les notes de version ci-dessus répertorient les modèles Adaptec suivants: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

Nous avons également obtenu des lignes de journal comme:

sd 0:0:0:0: timing out command, waited 360s

et

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

En recherchant en ligne pour voir d'autres personnes ayant un problème similaire, nous avons trouvé une autre ligne de cartes qui a eu les problèmes suivants corrigés par le firmware qui pourraient être pertinents:

Les deux ci-dessus s'appliquent aux modèles Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q et 81605ZQ.

sa289
la source
Je pense que mon contrôleur se bloquait lorsque j'utilisais l' arcconfutilitaire de ligne de commande pour interroger l'état de la baie dans le cadre de nos scripts de surveillance Nagios habituels. Comme l'indiquent les notes du micrologiciel, l'utilisation arcconfpeut entraîner le blocage du contrôleur.
Stefan Lasiewski