On m'a dit d'accepter une erreur avec Memtest86 +

52

Acheté un nouvel ordinateur en août avec 4 x 4 Go de RAM. Eu des problèmes avec la RAM. Ils m'ont envoyé quatre nouveaux bâtons, ce qui a également généré des erreurs. J'ai distingué quatre bâtons (sur les huit que j'avais maintenant) qui ne généraient aucune erreur. Découvert par hasard une nouvelle erreur de RAM la semaine dernière (sans BSOD cette fois). Contactez la société. Selon eux, il y a eu des problèmes avec un mauvais stock de l'été dernier, alors on m'a envoyé deux bâtons testés de 8 Go. Couru Memtest86 + au cours du week-end. Après 20 heures, j'ai eu une erreur (voir photo ci-jointe). Le test a maintenant été exécuté pendant 37 heures mais jusqu'ici seulement cette erreur une. J'ai contacté la société où j'ai acheté l'ordinateur. Ils ont répondu:

Je ne m'inquiéterais pas pour un échec.

Nous avons eu des situations similaires ici où il passe de nombreuses fois mais échoue une fois. Nous pensons que c’est un problème avec memtest, après tout, la mémoire est défectueuse ou ne l’est pas, vous ne pouvez donc pas le faire passer plusieurs fois, échouer la prochaine fois puis repasser!

Faites-moi confiance et continuez avec la mémoire que nous vous avons envoyée. Si vos problèmes persistent, nous essaierons de le faire remplacer à nouveau.

Je suppose que d’autres messages sur le forum indiquent que de nombreuses personnes n’acceptent pas une seule erreur. Que pourrait signifier cette simple erreur, RAM défectueuse ou problème dans le programme MEMTEST (ou autre)?

Mise à jour: D'après les commentaires utiles ci-dessous, je conclus qu'une erreur "aléatoire" occasionnelle (et rare) pourrait se produire et qu'elle était acceptable, mais des erreurs répétées à la même adresse indiqueraient un dysfonctionnement. Memtest a maintenant fonctionné pendant 45 heures et je n'ai toujours qu'une seule erreur. Pour l'information de tous, je vais continuer à faire le test. Dans moins de deux jours, je pars pour un mois. Je vais probablement laisser Memtest en cours d'exécution. Comme je n'ai pas d'onduleur, il y a un risque qu'une panne de courant ruine l'expérience. L’ordinateur étant un ordinateur de bureau, je ne peux donc pas l’apporter avec moi (ce qui l’aurait curieusement exposé à plus de rayons cosmiques, car je volerai;)).

Memtest

DustByte
la source
+1; Personnellement, je pense que c'est une excellente question, je suis désolé, je ne peux pas vous aider avec une réponse. J'ai légèrement mis à jour votre question pour m'assurer qu'elle ne soit pas hors sujet!
Dave
19
Personnellement, je ne voudrais pas transpirer un, et un seul, un échec ... RAM sans correction d'erreur peut parfois avoir un problème, ce n'est pas parfait. Maintenant, si vous pouvez dupliquer cela dans la même plage d'adresses, alors il y a quelque chose qui ne va pas avec cela.
Shinrai
C'est assez simple. L'erreur que vous avez signalée signifie que votre mémoire ne
contient
4
Êtes-vous sûr que ce n'est pas votre ordinateur qui a corrompu votre bélier?
Sanny Sin
5
D'accord avec @Shinrai - s'il n'y avait pas de pépin intermittent occasionnel avec de la RAM normale, il n'y aurait pas de marché pour la correction d'erreur de RAM . Les erreurs répétées à la même adresse sont une autre affaire, cela indiquerait une cellule de mémoire défectueuse.
jg-faustus

Réponses:

41

Directement de l'auteur Memtest86. Je les pousserais à le remplacer. Il ne devrait vraiment y avoir aucune erreur.

Si vous avez un nombre relativement petit d'adresses défaillantes et un ou deux bits d'erreur, vous pouvez être certain que les erreurs sont valides. Les erreurs intermittentes sont également valables sans exception. Les fournisseurs de mémoire se demandent souvent si Memtest86 prend en charge leur type de mémoire particulier ou un chipset. Memtest86 est conçu pour fonctionner avec tous les types de mémoire et tous les chipsets.

Toutes les erreurs de mémoire valides doivent être corrigées. Il est possible qu'une erreur particulière n'apparaisse jamais en fonctionnement normal. Cependant, le fonctionnement avec une mémoire marginale est risqué et peut entraîner une perte de données et même une corruption du disque. Même s'il n'y a pas d'indication manifeste de problèmes, vous ne pouvez pas supposer que votre système n'est pas affecté. Parfois, des erreurs intermittentes peuvent causer des problèmes qui ne se manifestent pas longtemps. Vous pouvez être sûr que Murphy vous comprendra si vous connaissez une erreur de mémoire et si vous l'ignorez.

BroScience
la source
4
Vous avez laissé de côté la partie où une définition étroite de "valide" est implicite: "On nous pose souvent des questions sur la fiabilité des erreurs signalées par Mestest86. Dans la grande majorité des cas, les erreurs signalées par le test sont valides. Certains systèmes Memtest86 a du mal à comprendre la taille de la mémoire et essaiera de tester une mémoire inexistante. Un grand nombre d'adresses consécutives seront alors considérées comme mauvaises et il y aura généralement beaucoup de bits erronés. "
Horatio
3
Il veut dire valide car dans "les erreurs intermittentes sont de vraies erreurs, pas un artefact de Memtest". Mais cela ne se traduit pas nécessairement par une mémoire RAM défectueuse. Des erreurs de RAM intermittentes se produisent, c'est pourquoi il existe une chose telle que la RAM corrigeant les erreurs . Google l'a mesuré sur ses serveurs: "un DIMM moyen enregistre près de 4000 erreurs corrigibles par an" . Voir aussi ZDNet
jg-faustus
28

Il semble qu’un seul bit soit corrompu (c’est-à-dire qu’il n’est pas réglé sur logique 1 comme prévu) à cette adresse. Si vous pouvez reproduire l'erreur, la RAM est défectueuse. Même une erreur reproductible sur 1 bit reste une erreur et peut entraîner des problèmes lors de l'utilisation de l'ordinateur.

La mémoire qui fonctionne correctement ne devrait * jamais ** comporter d'erreurs, comme le souhaite un ordinateur (et c'est pourquoi elles plantent en cas de mauvaise mémoire, par mesure de sauvegarde; vous ne pouvez pas exécuter de manière fiable un ordinateur avec une mémoire insuffisante, car ce dernier pourrait être corrompu. instructions ou fournir / stocker des données corrompues ).


* sur une période suffisamment longue, il est possible que les bits de la DRAM soient corrompus par des sources externes telles que le rayonnement de fond; L'événement est généralement si rare que la plupart des ordinateurs exécutent Memtest pendant des semaines sans erreur. Voir également la question Stack Overflow, " Rayons cosmiques: quelle est la probabilité qu'ils affectent un programme? ".

Percée
la source
Jusqu'ici pas plus d'erreurs. Le test est toujours en cours. À ce stade, il n’est peut-être qu’hypothétique de demander «et s’il s’agit de la seule erreur que j’obtiens après avoir exécuté le test pendant une semaine?
DustByte
6
@DustByte alors je suppose que c'est bien. Le problème ne se poserait que si la même erreur se produisait au même emplacement mémoire, ce qui indiquerait une cellule DRAM défectueuse. De nombreux facteurs peuvent modifier le taux d'erreur de la RAM, y compris le rayonnement de fond (par exemple, lors de tempêtes de rayons cosmiques ou d'autres sources de rayonnement).
Percée
5
dans un cas, Fermilab a mesuré 2,5 "événements uniques" par jour sur plusieurs machines avec 160 Gbits combinés. Ils ont attribué cela au rayonnement de fond. L'altitude compte dans ce cas: Boulder Colorado le verra plus souvent qu'à Death Valley
horatio
Cette question de Stack Overflow était vraiment perspicace - je n’avais pas réalisé que le taux d’erreur dû au rayonnement cosmique était aussi élevé.
Shinrai