Comment diagnostiquer les blocages et blocages informatiques?

29

J'ai construit un ordinateur de bureau il y a quelques années avec les spécifications suivantes:

  • Processeur: Intel Core 2 Quad Q9300 Yorkfield 2,5 GHz, 6 Mo de cache L2 LGA 775, processeur quadricœur 95 W BX80580Q9300
  • Carte mère: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Intel Motherboard
  • Carte vidéo: Deux EVGA 256-P2-N758-TR GeForce 8600GT 256 Mo SCC 128 bits GDDR3 PCI Express x16 SLI prises en charge Carte vidéo
  • PSU: SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2.3 / EPS12V V2.91 SLI Certified CrossFire Ready 80 PLUS Certified Active PFC Power Supply
  • Mémoire: Deux G.SKILL 4 Go (2 x 2 Go) DDR2 SDRAM DDR2 800 à 240 broches (PC2 6400) Kit de mémoire de bureau modèle F2-6400CL5D-4GBPQ

Depuis sa création, la machine s'est verrouillée périodiquement, la régularité ayant varié au fil des ans d'une fois par jour à une fois par mois. En règle générale, les blocages se produisent une fois tous les quelques jours.

Par «verrouillage», je veux dire que mon ordinateur se fige. L'écran se bloque, je ne peux pas déplacer la souris. Frapper les touches de mon clavier qui normalement allument ou éteignent les voyants du clavier (comme le verrouillage des majuscules) n'allument plus les voyants. S'il y avait de la musique jouée au moment du verrouillage, le bruit continue de sortir des haut-parleurs, mais c'est juste la fréquence / note actuelle qui joue indéfiniment. Il n'y a pas de BSOD.

Lorsqu'un tel blocage se produit, je dois effectuer un redémarrage matériel en éteignant l'ordinateur ou en appuyant sur le bouton de réinitialisation.

J'ai la version la plus récente des pilotes matériels NVIDIA et je les mets à jour semi-régulièrement, mais cela n'a pas semblé aider. J'utilise actuellement Windows 7 x64, mais j'utilisais auparavant Windows Server 2003 x64 et j'ai les mêmes problèmes de verrouillage.

Je suppose que c'est en quelque sorte lié au pilote vidéo ou à la carte mère, mais je ne sais pas comment diagnostiquer ce problème pour déterminer lequel des deux est le coupable.


Informations supplémentaires concernant le refroidissement En ce qui concerne le refroidissement ... Je n'ai installé aucun système de refroidissement après-vente à part deux ventilateurs ordinaires que j'ai récupérés d'un ancien ordinateur. Le ventilateur au sommet du CPU est celui qui l’a livré. L'un des deux ventilateurs récupérés, je l'ai ajouté situé dans la tour inférieure du coin, dans le but de créer un flux d'air d'avant en arrière. Le deuxième ventilateur est dirigé directement vers les deux cartes vidéo.


Installation et lectures de SpeedFan Selon la suggestion de studiohack, j'ai installé SpeedFan , qui a fourni les lectures de température suivantes:

  • GPU: 63C
  • GPU: 65C
  • Système: 76C
  • CPU: 64C
  • AUX: 36C
  • Noyau 0: 78C
  • Noyau 1: 76C
  • Noyau 2: 79C
  • Noyau 3: 79C

Mise à jour # 3: un autre verrouillage :-( Eh bien, j'ai eu un autre verrouillage la nuit dernière. :-( SpeedFan a signalé la température du processeur à 38 ° C quand cela s'est produit, et il n'y avait pas de pic de température menant au gel.

Une chose que je remarque, c'est que le gel semble plus susceptible de se produire si je regarde une vidéo. En fait, sur les 5 derniers gels du mois dernier, 4 d'entre eux l'ont été en regardant une vidéo sur Flickr. Pas forcément la même vidéo, mais une vidéo quand même. Je ne sais pas si c'est juste une coïncidence ou si ça veut dire quelque chose. (En passant, chaque soir avant le coucher, ma fille de 2 ans s'assoit sur mes genoux et regarde des vidéos personnelles sur Flickr et, au cours du dernier mois, a appris la phrase "Uh oh, l'ordinateur s'est cassé.")


Mise à jour # 4: Résultats des tests MemTest86 et 3DMark06 :

Selon les suggestions dans les commentaires, j'ai exécuté le MemTest86 pendant la nuit et il a parcouru les 8 Go de mémoire 5 fois sans erreur. J'ai également exécuté le test 3DMark06 sans problème (voir mes scores sur http://3dmark.com/3dm06/15163549 ).

Alors ... et maintenant? :-)

Avez-vous d'autres suggestions à vérifier? Existe-t-il un moyen d'obtenir une trace de pile ou quelque chose lorsque l'ordinateur se verrouille comme ça?

Résolution

Je n'ai jamais compris les problèmes particuliers, mais sur la base des suggestions ici et ailleurs, je suppose que c'était un problème de carte mère. Quoi qu'il en soit, j'ai récemment mis à niveau mon système, en achetant une nouvelle carte mère, un bloc d'alimentation, un processeur et une RAM, et cette nouvelle plate-forme a fonctionné à merveille au cours des dernières semaines. J'utilise les mêmes cartes graphiques que dans l'ancienne configuration, donc je pense qu'il est prudent de penser qu'elles n'étaient pas la cause du problème.

Scott Mitchell
la source
le premier mot qui me vient à l'esprit est la chaleur ... comment gardez-vous le système au frais?
James Mertz
@KronoS: J'ai modifié ma question pour inclure la situation de refroidissement. Notez que je n'utilise aucun logiciel de surveillance de la température du processeur.
Scott Mitchell
2
Vous devez installer SpeedFan et nous faire savoir les températures ...
studiohack
@studiohack: Merci pour la suggestion - j'ai téléchargé et installé SpeedFan et édité ma question pour inclure ces nouvelles lectures. Ces relevés de température sont-ils normaux?
Scott Mitchell
2
@Scott Télécharger 3dMark '06 et FurMark ont ​​laissé fonctionner pendant quelques heures. Signalez tous les plantages. En cas de panne, n'utilisez qu'une seule carte vidéo à la fois
Sathyajith Bhat

Réponses:

11

À en juger par la température et le refroidissement que vous avez affichés, votre ordinateur surchauffe et c'est la première chose à rectifier. 64 C sur une charge inactive n'est pas acceptable et n'est pas vraiment préféré avec une charge complète. Je suis un peu paranoïaque et panique à chaque fois que mon processeur dépasse 35, mais vraiment 50 devrait être votre maximum sur une charge.

Investissez dans une bonne solution de refroidissement pour votre système. Un système assez décent ne vous coûtera que 20 à 30 dollars. Si vous cherchez de l'aide sur quoi chercher, jetez un œil à cette revue Tom's Hardware des solutions de refroidissement inférieures à 40 $.

Vous pouvez également vouloir activer votre écran bleu de la mort (aussi terrible que cela puisse paraître) afin de pouvoir déboguer les blocages problématiques. Cela se fait par:

-> clic droit sur "Ordinateur" dans le menu démarrer

-> Sélectionnez "Propriétés"

-> Sélectionnez "Paramètres système avancés"

-> Sélectionnez l'onglet "Avancé"

-> Sélectionnez le "Démarrage et récupération"

-> Assurez-vous que "Écrire un événement dans le journal système" est activé.

Parfois, il existe des nettoyeurs qui empêchent automatiquement l'enregistrement des BSOD ( Advanced System Care ) et vous voudrez peut-être chercher à empêcher cela. Une fois que vous avez vérifié ce problème, je suggère d'utiliser BlueScreenView de NirSoft pour afficher les détails liés au crash / problèmes liés au débogage.

Enfin, je voudrais vérifier et revérifier votre PC et TOUTES vos connexions. En fait, j'ai eu une situation similaire et j'ai découvert que l'un des câbles USB de la carte mère interne n'était pas correctement connecté, provoquant ainsi des problèmes.

Mise à jour

J'ai rassemblé quelques questions pour le dépannage général et le diagnostic des plantages ou des gels. Veuillez également vous y référer, car ils peuvent également vous aider dans votre recherche du problème.

James Mertz
la source
@KronoS: Avez-vous des systèmes de refroidissement recommandés à partager?
Scott Mitchell
@ScottMitchell ... réponse mise à jour. Je vous recommande fortement de faire vos recherches, car la situation de chaque super utilisateur est différente.
James Mertz
3
@ScottMitchell Je vous recommande de changer le matériau de l'interface thermique (TIM aka pâte thermique) avant d'ajouter tout refroidissement externe. Vérifiez également la présence de poussière sur les ventilateurs / grilles / évents et nettoyez-les à l'aide d'un jet d'air comprimé.
Sathyajith Bhat
@Sathya: Merci pour la suggestion. J'ai cassé le boîtier la semaine dernière et j'ai fait tourner l'ordinateur pendant une journée avec un boîtier ouvert et les températures sont tombées dans les années 40. Ce matin, j'ai inspecté le système de refroidissement existant du CPU et j'ai remarqué que beaucoup de poussière recouvrait les grilles sous le ventilateur, alors je les ai nettoyées. J'ai remis le boîtier en place et nous verrons si les températures restent basses et si cela aide à éviter les gels futurs. (Si oui, je vais marquer cela comme la réponse ...)
Scott Mitchell
@Scott Ah heureux d'entendre, tenez-nous au courant.
Sathyajith Bhat
5

Les blocages système intenses (où vous ne pouvez pas utiliser de raccourcis clavier comme CTRL + ALT + SUPPR) sont causés par des pilotes suspendus,
vous devrez donc remplacer le périphérique ou mettre à jour le pilote. Le dépannage peut être fait:

  1. Téléchargez la configuration à partir des outils d'analyse des performances de Windows pour votre version de Windows.
  2. Installez le logiciel sur votre système.
  3. Ouvrez une invite de commande en tant qu'administrateur et copiez-collez la commande suivante:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. Appuyez ENTER une fois pour lancer la commande, vous devrez maintenant attendre que votre système se bloque.
    Vous pouvez faire ce que vous voulez. S'il vous plaît pas d'activité lourde comme les jeux ou les choses privées ...

  5. Immédiatement après que votre système a cessé de se bloquer, accédez à la console et appuyez sur ENTER.
  6. Après avoir attendu un certain temps, un fichier journal myTrace.etl sera produit, compressez-le dans un fichier zip.
  7. Mettez cette version compressée du fichier quelque part en ligne (peut-être 2shared).
  8. Partagez le lien ici, je ferai une tentative pour trouver et vous montrer la cause de votre problème.
Tamara Wijsman
la source
11
Question re: étape 5 - que dois-je faire si le système ne s'arrête jamais jusqu'à ce que je redémarre la machine?
Scott Mitchell
@ScottMitchell: Essayez plutôt de créer un vidage sur incident manuel dans ce cas.
Tamara Wijsman,
4

Si cela fait quelques années que l'ordinateur a été construit, un nettoyage en profondeur serait un bon plan d'action. Retirez toute la poussière des ventilateurs, dissipateurs de chaleur, planches et coins. Les pièces les plus importantes sont les dissipateurs thermiques et les ventilateurs du processeur. L'air comprimé est bon à cet effet, mais un aspirateur peut être plus sain à long terme. Faire cela à fond réduira considérablement la ventilation et réduira la chaleur.

La chaleur n'aurait pas dû être un problème avec un nouvel ordinateur, sauf si elle est conservée dans une pièce (ou armoire) très chaude et mal ventilée. Les fabricants de CPU prévoient que leurs produits seront utilisés dans des conditions variables et même le dissipateur de chaleur et le ventilateur d'origine sont conçus pour permettre au produit de fonctionner dans la plupart des circonstances.

Puisque vous avez eu des problèmes depuis que vous l'avez construit, j'ai tendance à pencher vers une défaillance de l'un des composants. Sur la base des problèmes décrits, je penche vers une carte mère défectueuse, basée uniquement sur ma propre expérience.

Xantec
la source
1
Comme je l'ai noté dans ma question, ce problème de gel se produit avec une certaine régularité depuis que j'ai construit l'ordinateur. Malheureusement, ce n'est pas récent.
Scott Mitchell
correct. c'est pourquoi je penche vers un équipement défectueux plutôt que vers la chaleur, car la chaleur n'aurait pas dû être un problème lorsque vous l'avez construit (à moins que l'endroit où vous gardez l'ordinateur soit très chaud pour commencer)
Xantec
La chaleur aurait pu être un problème lors de la construction du système. Nous avons déjà reçu un poste de travail à double processeur d'un grand fabricant avec les ventilateurs du processeur connectés aux broches du ventilateur de la carte mère de l'autre processeur. ... Mais probablement pas le problème dans ce cas.
Mike Chess
1

J'ai suivi ce processus l'année dernière.

La première chose est de déterminer s'il s'agit de matériel ou de logiciel. Cela signifie exécuter deux systèmes d'exploitation différents dessus. Dans mon cas, mon installation principale était Linux, et elle gelait au hasard - similaire à ce que vous décrivez. Parfois, toutes les 5 minutes, d'autres fois, cela durait plusieurs jours.

J'ai finalement installé Windows dessus, qui a rencontré les mêmes problèmes. Lorsque j'ai redémarré, et qu'il s'est bloqué pendant le post, j'ai renvoyé le MB et je n'ai eu aucun problème depuis.

Dans le cadre du processus de débogage, j'ai également essayé différents pilotes vidéo - les pilotes génériques non accélérés ne se figeaient pas aussi souvent. J'ai également installé temp. surveiller les utilitaires et consulter les journaux pour voir s'il se passait quelque chose de commun avant le gel. Comme il s'agissait de matériel et apparemment aléatoire, je n'ai jamais trouvé de moyen de provoquer le problème de manière fiable, mais cela devrait être votre objectif.

chris
la source
Je ne sais pas exactement ce que vous proposez ici?
James Mertz
S'il s'agit d'un problème avec le matériel, le problème sera présent quel que soit le système d'exploitation. S'il n'apparaît qu'avec un seul système d'exploitation, et pas un autre, il s'agit probablement d'un logiciel.
chris
1
@chris: Le problème existe depuis que j'ai construit l'ordinateur. Au départ, j'utilisais Windows Server 2003, puis j'ai mis à niveau vers Windows 7. Avec les deux systèmes d'exploitation, j'ai rencontré ces blocages / blocages.
Scott Mitchell
@Scott - Surveillez-vous également les températures du GPU? Si plusieurs systèmes d'exploitation rencontrent le même problème, je pencherais pour le matériel, même si je suppose que les deux utilisent le même pilote vidéo. Avez-vous essayé de retirer l'une des cartes vidéo et de voir si vous pouvez la réduire à une carte spécifique?
chris
1
Eh bien, si vous faites l'hypothèse que ce ne sont pas les cartes vidéo, cela laisse de la mémoire, une carte mère ou un logiciel. Si vous excluez le logiciel en raison du problème avec Win7 et Win2003 (ce que je ne voudrais pas), cela laisse de la mémoire ou des Mo. Pouvez-vous échanger la RAM?
chris
1

Je soupçonnerais d'abord l'alimentation. Essayez de le remplacer par une unité de puissance supérieure et voyez si les choses deviennent plus stables. Il se peut que les rails de tension s'affaissent un peu sous la charge, ce qui explique pourquoi cela apparaît plus fréquemment lors de la lecture vidéo.

Pour tester cette théorie, vous aurez besoin d'un voltmètre précis et de quelques compétences électriques de base, mais étant donné l'utilité d'une alimentation de rechange, je serais tenté de l'échanger et de voir.

Cynique optimal
la source
1

Sur la base de votre mise à jour # 3 et d'un blocage à 38 ° C, la chaleur mobo / cpu n'est pas la cause première. En supposant que vous n'avez ajouté que les cartes vidéo et aucune autre carte supplémentaire (j'ai déjà fait un bon travail!), Je fais ces recommandations par ordre de ce que je pense être la cause la plus probable:

  • Remplacez les cartes vidéo par une autre bonne carte connue pour dépanner. Achetez-en un, empruntez-en un. Si cela ne résout pas, passez à la puce suivante.

  • Vous avez mentionné la mise à jour du pilote de la carte vidéo, mais rien d'autre. Assurez-vous que tous les pilotes possibles sont bien à jour. J'ai eu une belle carte à faire une seule fois et tout ce que j'avais à faire était de mettre à jour le pilote.

  • Si vous n'avez en effet aucune autre carte d'extension (si vous en avez, supprimez-les maintenant), désactivez tous les équipements optionnels dans le bios. J'entends par là votre son intégré, lan et retirez tous les éléments USB. Ensuite, voyez si ça part.

Je vais sortir sur un membre et dire que je suis sûr à 90% que cela sera corrigé en faisant la puce # 1.

Flotsam N. Jetsam
la source
1

Probablement un problème de carte vidéo, a remplacé de nombreux 8600 GT (G84). Ce fut un gros flop du côté de NVIDIA, en particulier. en série pour ordinateur portable (8x00M).

La température du GPU de 65 ° C semble trop élevée si elle était inactive.

Exécutez un test de rodage de cinq minutes avec Furmark; s'il se bloque - la carte vidéo est coupable.

Problèmes https://en.wikipedia.org/wiki/GeForce_8_Series#Problems

Furmark http://www.ozone3d.net/benchmarks/fur/

nomen_n
la source
0

Il semble que le matériel ou les pilotes soient le problème ici. Bien que je pencherais sur du matériel puisque vous avez eu deux systèmes d'exploitation différents sur l'ordinateur.

En travaillant sur cette hypothèse, commencez par les choses les plus simples. J'ai vu que vous avez exécuté Memtest et même si c'est génial, cela n'exclut pas nécessairement la mémoire comme suspecte. Essayez donc ce qui suit: sortez tout sauf un bâton de mémoire et voyez si vous obtenez un blocage. S'il fonctionne correctement pendant un certain temps, insérez-en un de plus et ainsi de suite jusqu'à ce que le problème se reproduise. S'il se bloque toujours, essayez un autre bâton dans un emplacement différent. S'il se bloque toujours, passez à d'autres composants matériels.

Certaines personnes ont mentionné avoir tenté d'échanger votre carte vidéo et je suis d'accord. Achetez-en un bon marché ou empruntez-en un à un ami et essayez-le. Faites de même avec une alimentation. Votre bloc d'alimentation semble décent, mais ils tournent mal et cela vaut la peine d'être remplacé et de voir si cela résout votre problème.

Si tout cela échoue, je dirais remplacer la carte mère. Surtout depuis que vous avez dit que vous aviez eu le problème depuis que vous aviez l'ordinateur.

Une dernière chose à vérifier juste pour être du bon côté. Faites un test chkdsk / SMART sur vos disques durs. Ils sont probablement bien mais valent quand même la peine d'être vérifiés.

Nori
la source
0

D'après votre description, il semble que le problème se trouve sur la carte mère. Il se peut que votre northbridge ait un problème ( schéma de la carte mère ). Ce que je vérifierais également, c'est la configuration du BIOS pour le générateur d'horloge et la vitesse du processeur. (Je ne connais pas votre carte mère mais peut-être qu'elle a des fonctionnalités d'overclocking.) Peut-être que les problèmes se produisent toujours lorsqu'il y a une charge élevée et que le CPU essaie de fonctionner plus rapidement.

Raffael
la source
0

Je vais sur une aile ici et suggère que le coupable est un condensateur soufflé qui est incapable de fournir une charge électrique pour atténuer les erreurs de fluctuation de courant. Je suppose qu'une fluctuation suffisamment importante entraînera le gel du système mais restera allumé.

Sur la base de l'expérience passée, je blâmerais un condensateur grillé dans votre bloc d'alimentation (PSU), mais je suggérerais de vérifier tous les condensateurs de votre ordinateur, dans et autour de la carte mère, en particulier autour du pont nord. Si vous avez dépassé la fréquence, la carte mère a probablement été frite. Bien qu'il soit peu probable que des condensateurs aient sauté sous les dissipateurs de chaleur, cela peut également être une possibilité.

Si vous ne trouvez rien soufflé sur la carte mère, je garantirais votre PSU car certains ont une longue garantie - la mienne de 7 ans - alors ne l'ouvrez pas pour l'inspecter sauf si vous savez que vous n'êtes pas sous garantie. Une alimentation électrique décente peut être réparée avec les bons outils s'il ne s'agit que d'un condensateur.

Jonathan
la source
-1

J'ai géré de nombreuses situations comme celle-ci, et le problème le plus courant que j'ai rencontré avec les blocages ou le gel était la pâte de dissipateur de chaleur. Votre ventilateur peut faire ce qu'il veut, mais si un espace d'air entre le dissipateur thermique et le processeur est autorisé, le dissipateur thermique ne refroidira pas l'air entre les deux. Si cette pâte est trop séchée ou sur des endroits, elle n'est pas censée être ou pas assez ou ne pas permettre une connexion de chaleur conductrice entre le processeur et le dissipateur, elle se bloquera car elle allume un circuit de protection du processeur dans le processeur lui-même . Faites-le cinq ou six fois jusqu'à ce que ce problème disparaisse. Il finira par le faire, ou nous jetterons votre processeur et vous en enverrons un nouveau sans même vous le dire. Nous ne voulons pas remplacer votre CPU. Nous le faisons 10 fois avant de le faire.

Pertinent mais ne peut pas vous dire
la source
1
Je peux croire que vous savez peut-être de quoi vous parlez, mais je ne comprends pas ce que vous dites. Veuillez modifier votre réponse pour clarifier –– Je vous ai donné un début. Par exemple: «Faites-le cinq ou six fois…» –– faites quoi? «Nous le faisons 10 fois…» –– faire quoi et qui sommes «nous»? Veuillez également clarifier ce que vous dites que Sathya ♦ n'a pas déjà dit dans son commentaire du 10 décembre 2010 à 21:36 .
Scott
-1

Il peut s'agir d'un problème de pilote - chaque fois qu'il est sur le point de gérer votre vidéo, il se bloquera très probablement (cela peut également faire un bruit étrange) car votre écran se fige - le processeur peut toujours fonctionner - en fait, tout pourrait fonctionner - vous pouvez ne pouvez tout simplement pas voir les résultats de vos manipulations souris / clavier, car une fois que votre pilote plante, il n'y a plus rien pour gérer les représentations visuelles des entrées.

Solution potentielle: mettez à jour le pilote, s'il a démarré lorsque vous avez mis à jour un pilote, revenez au pilote précédent, si votre carte graphique est ancienne - essayez d'en acheter une nouvelle - parfois, lorsque d'anciennes cartes sont corrigées avec de nouveaux pilotes, elles peuvent être boguées.

La surchauffe n'est vraiment un problème que lorsque votre carte fonctionne à 110% de sa puissance de fabrication, elle peut provoquer un crash, mais encore une fois, si vous l'avez augmentée très fortement.

Enariel
la source
C'est une supposition, bien que décente. Mais cela pourrait aussi être de la puissance, un composant individuel défaillant, de la chaleur quelque part en plus du CPU (GPU, disque dur). Cela pourrait aussi être une mauvaise installation.
Austin T French
-2

Je suis d'accord avec Nori sur la réalisation d'un test SMART. Utilisez (l'édition gratuite) HDTune pour copier les attributs SMART. Effectuez également une analyse des erreurs. Un seul secteur endommagé peut provoquer les problèmes que vous décrivez. Une surchauffe provoque généralement des BSOD et un redémarrage forcé ou un arrêt. Puisqu'il "gèle", cela ressemble plus à un problème de disque dur (même si de mauvais disques durs peuvent aussi causer des BSOD).

Vérifiez l'état SMART et notez les données "Nombre d'heures de mise sous tension". Si le décompte n'augmente pas après quelques heures, les attributs SMART sont probablement figés et vous donnent un faux statut "OK".

Vérifiez également les journaux d'événements de votre système et de votre application Windows pour les erreurs.

(panneau de contrôle -> Outils d'administration -> Gestion de l'ordinateur -> Observateur d'événements)

Assurez-vous d'avoir sauvegardé toutes vos données importantes.

James T
la source
Les problèmes de disque s'aggravent presque toujours avec le temps, ce qui n'est pas le cas dans la description.
Flotsam N. Jetsam
@Flotsam Bon point. Un disque dur feuilleté serait probablement mort après quelques années. Peut-être un contrôleur RAID feuilleté alors. Les journaux d'événements peuvent toujours fournir de bons conseils.
James T
Pas terrible conseil mais pas sur place pour cette configuration et description des symptômes.
Ярослав Рахматуллин