Souhaitez-vous utiliser la RAM ECC sur un poste de travail?

21

La RAM ECC est-elle recommandée pour une utilisation sur les postes de travail, ou est-ce quelque chose qui n'est utilisé que sur les serveurs? Si la RAM non ECC fonctionne sur les PC, pourquoi aurions-nous besoin de RAM ECC?

Jon Tackabury
la source

Réponses:

25

Au fur et à mesure que les choses sont stockées dans la gauche et finalement retirées de la RAM, une corruption se produit naturellement (les théories varient, mais celle qui a le plus de poids en ce moment est l'EMI de l'ordinateur lui-même). ECC est une fonctionnalité de RAM et de cartes mères qui permet la détection et la correction de cette corruption.

La corruption est généralement assez mineure (ECC peut généralement détecter et corriger 1 à 2 bits par "mot" 64 bits - et c'est waaaaay au-delà des taux d'erreur typiques), mais augmente en fréquence avec la densité de la RAM. Votre poste de travail / PC moyen ne le remarquera jamais. Sur un serveur où vous exécutez une RAM haute densité 24h / 24 et 7j / 7 dans un environnement à forte demande desservant des services critiques, vous prenez toutes les mesures possibles pour éviter que des éléments ne se cassent.

Notez également que la RAM ECC doit être prise en charge par votre carte mère et que la station de travail / PC moyenne ne la prend pas en charge.

La RAM ECC est plus chère que la non-ECC, est beaucoup plus sensible aux vitesses d'horloge et peut entraîner un petit coup (1-2%) de performances. Si cela aide, une analogie qui fonctionne est la RAM avec les contrôleurs RAID. Sur votre PC, ce RAID logiciel assisté par matériel intégré à votre chipset est une excellente protection contre les pannes de disque unique. Sur un serveur, cela ne serait jamais suffisant. Vous avez besoin d'un RAID haut de gamme entièrement sauvegardé par batterie avec RAM intégrée pour vous assurer de ne pas perdre de données en raison d'une panne de courant, d'une panne de disque ou autre.

Donc non, vous n'avez pas vraiment besoin de RAM ECC sur votre poste de travail. L'avantage ne justifie tout simplement pas le prix.

sh-beta
la source
2
Comme l'a également souligné dans la réponse de Basil Bourque , les prix ont à peu près convergé ces jours-ci (quand j'ai regardé plus récemment, la différence de prix était le ~ 10% que vous attendez de la zone de puce supplémentaire, pour la même quantité de RAM utilisable) . À la lumière de cela, il pourrait être utile de revoir en particulier la dernière phrase.
un CVn
10

Si cet article doit vous aider, vous devez utiliser la RAM ECC.

Il ne s'agit pas seulement de "Je ne gère pas de serveur, donc je n'en ai pas besoin". Cela dépend de la valeur que vous accordez à vos données. Ce n'est pas seulement une question d'accidents occasionnels - le problème est que vous pouvez être corrompu et n'avoir aucun moyen de savoir que cela se produit.

geofftnz
la source
3
De l'article: "[...] 4 Go de RAM ont 96% de chances d'avoir une erreur de bit en trois jours sans RAM ECC". Cela semble que les ordinateurs doivent se bloquer constamment et que les données doivent être corrompues en permanence. Pourtant, tout le monde semble aller très bien sans ECC ... pourquoi?
Calimo
1
C'est parce que cet article est faux en ce qui concerne le taux d'erreur. Le taux d'erreur réel est inférieur de plusieurs ordres de grandeur. Voir le fil reddit pertinent reddit.com/r/programming/comments/ayleb/…
mimrock
Quel que soit le taux d'erreur, il dépend également de ce qui est affecté. Les chances sont que ce n'est pas quelque chose qui provoque un crash système.
sudo
8

La RAM ECC devient plus intéressante à mesure que la taille de la mémoire augmente. La probabilité d'une erreur sur un seul bit dans une machine avec 8 Go de RAM est beaucoup plus élevée qu'elle ne l'était à l'époque d'un 640K PC / XT, simplement en raison du plus grand nombre de bits. Sur un serveur de base de données où cette RAM peut se trouver dans un tampon de disque, une erreur de bit peut également corrompre le stockage sur disque. En règle générale, vous vous attendez à utiliser la mémoire ECC sur un serveur.

Certaines stations de travail (en particulier celles avec des processeurs Xeon ou Opteron) acceptent la mémoire enregistrée, qui ne vient à peu près qu'en versions ECC de toute façon. Sur un ordinateur de bureau, vous pouvez le considérer comme excessif.

ConcernedOfTunbridgeWells
la source
4

ECC RAM est conçu pour aider à prévenir et à corriger les erreurs basées sur la mémoire, en utilisant généralement une sorte de code de brouillage ou une redondance modulaire. C'est très utile dans les serveurs qui contiennent des données importantes ou qui nécessitent une haute disponibilité, mais cela a un coût.

Bien que cela vaille probablement la peine de payer un supplément pour vos serveurs importants, voulez-vous vraiment le faire pour votre ordinateur de bureau, est-ce important s'il y a parfois une erreur de mémoire? Bien sûr, cela importe si votre base de données SQL supprime certaines données lors d'une transaction, mais vous souciez-vous si votre document Word est affecté par un léger problème de mémoire?

Sam Cogan
la source
4

Si vous voulez un poste de travail fiable, alors vous voulez de la RAM ECC pour cela. Il plantera moins souvent et le travail effectué dessus et les documents mis en cache dans la RAM ne seront pas corrompus au hasard.

Zan Lynx
la source
4
Cela semble être une chance incommensurablement petite d'améliorer la stabilité. Les seuls accidents liés à la RAM que je connaisse sur les postes de travail sont dus à une mauvaise RAM ou à de mauvaises applications, jamais quelque chose qu'ECC aurait empêché. Cela a du sens (lire: encore un tout petit peu) de sens sur les serveurs où vous crunch constamment des téraoctets de données, mais sur les postes de travail, la seule chose qui se rapproche est peut-être le rendu graphique haut de gamme ou le traitement vidéo. En bref, je pense que vous pouvez obtenir une station de travail complètement fiable sans RAM ECC.
Chris Thorpe
J'ai couru memtest86 plusieurs fois pendant la nuit sans aucune erreur. C'est à cette fréquence que le flip de mémoire se produit ... Si des vies en dépendent, cela justifierait l'utilisation de l'ECC, sinon je ne pense pas que ce soit un vrai problème dans 99,9% des cas. Il est très peu probable qu'un bit aléatoire par mois atteigne quelque chose de critique en téraoctets de données.
inf3rno
Ofc. ZFS est une exception.
inf3rno
1
@ inf3rno Cet argument? La nuit n'est rien. L'altitude compte. J'habite au Colorado et sur le système ECC, je vois plusieurs erreurs corrigibles chaque mois. Revenez avec les journaux d'un système ECC ou vous n'avez aucune information. Lisez également le rapport de Google sur les erreurs ECC.
Zan Lynx
4

Un avantage supplémentaire de l'ECC par rapport à ce qui a été mentionné ci-dessus est que vous pouvez détecter une mauvaise RAM. Bien que l'exécution d'une longue session memtest86 trouve généralement des problèmes, il peut y avoir des problèmes très spécifiques avec la RAM qui n'apparaissent que rarement et dans certains cas d'utilisation. Cela peut toujours se produire beaucoup plus fréquemment que la corruption contre laquelle une bonne RAM ECC est conçue pour se protéger - peut-être une fois par mois. Donc, si vous installez un logiciel de surveillance, vous pouvez être sûr que votre RAM est bonne ou remplacer les puces défectueuses. Encore un avantage marginal, mais comme la mémoire ECC n'est pas beaucoup plus chère que la RAM normale, cela en vaut la peine.

Marius Bjørnstad
la source
1

La mémoire ECC coûte désormais à peu près le même prix que la mémoire non ECC, car les prix ont baissé. Vérifiez donc les prix; si les prix sont proches, achetez ECC si votre poste de travail le permet.

Basil Bourque
la source
1

Je pense qu'il peut y avoir une certaine confusion fondée uniquement sur le titre de la question.

Si vous voulez simplement dire le PC de bureau moyen, cela est généralement basé sur une plate-forme qui ne prend même pas en charge ECC.

Si vous voulez dire un ordinateur de classe poste de travail , il est très probable qu'il soit accompagné d'une mémoire ECC, que vous vous en souciez ou non.
Dans l'ensemble, la classe de poste de travail est généralement basée sur du matériel essentiellement serveur, mais avec des graphiques appropriés et emballée dans un facteur de forme différent.

La charge de travail attendue est également plus éprouvante que celle du PC de bureau, donc si vous reconnaissez qu'ECC a du sens pour les serveurs, alors je pense que ce n'est pas vraiment un tronçon qu'ECC a également du sens pour les postes de travail.

Pour les PC de bureau, il y a un débat pour savoir si ECC aurait du sens ou non. On peut absolument affirmer que tout devrait avoir ECC mais, pour le moment, ce n'est pas pratique car l'industrie a décidé de faire d'ECC une fonctionnalité pour différencier le matériel haut de gamme.

Håkan Lindqvist
la source
0

Selon l'article lié par Zan Lynx dans les commentaires: Erreurs DRAM dans la nature: une étude de terrain à grande échelle , les erreurs non corrigibles sont courantes tandis que les erreurs corrigibles aléatoires apparaissent rarement dans un système. L'incidence est probablement de quelques en un an, mais cela dépend de l'utilisation.

Ainsi, dans un environnement de serveur, les erreurs corrigibles peuvent ne pas être si importantes, mais vous démarrez rarement les machines du serveur, de sorte que les erreurs non corrigibles causées par une RAM défaillante peuvent être là non détectées pendant un certain temps en corrompant vos données. Je pense que c'est la principale raison pour laquelle les serveurs ont besoin d'ECC. Les postes de travail démarrent et vérifient donc fréquemment la RAM, afin que les pannes matérielles puissent être détectées à chaque redémarrage. Si cette fréquence est suffisante pour votre entreprise, je pense que vous n'aurez pas besoin de RAM ECC sur votre poste de travail.

Si nous parlons d'erreurs de mémoire, il est préférable de versionner les documents importants sur le serveur. Donc, si le poste de travail lit et modifie quelque chose, le contenu d'origine ne doit pas être écrasé sur le serveur. Les sauvegardes régulières peuvent faire de même pour vous.

Un autre aspect de cette question est la sécurité. Si votre poste de travail est connecté à un réseau non sécurisé, il peut être vulnérable à l' attaque par marteau de ligne , qui exploite un phénomène lié à la DRAM. Donc, du point de vue de la sécurité, il est préférable d'utiliser la RAM ECC.

inf3rno
la source