Je me passionne beaucoup pour la construction de machines stables - en ce sens que je déteste absolument les crashs, les redémarrages, les comportements amusants, etc. - et que corriger les erreurs, dit ECC RAM, semble résoudre un gros problème: les erreurs de mémoire.
Mais ça marche vraiment? Existe-t-il un avantage mesurable, par exemple moins d'accidents ou d'autres comportements?
Outre le coût, pourquoi ne pas utiliser la mémoire ECC pour une nouvelle version de PC? Pourquoi la fonctionnalité ECC est-elle principalement disponible et prise en charge pour les ordinateurs de type serveur / poste de travail, mais pas pour les cartes mères grand public?
Réponses:
J'ai utilisé la RAM ECC dans les serveurs depuis quelques années maintenant. ECC brille vraiment lorsque vous utilisez beaucoup votre machine, comme dans "c'est plus de 12-16 heures par jour". Les petits serveurs whitebox que j'ai construits sans ECC ont, tôt ou tard, développé des "problèmes" qui nécessitaient un redémarrage, mais les machines ECC ne les ont jamais rencontrés.
Ma réponse est donc la suivante: si vous utilisez beaucoup votre ordinateur , alors probablement. Si vous utilisez votre ordinateur 24h / 24 et 7j / 7, il devrait être indispensable.
Certaines cartes mères supportent ECC. Ils se situent généralement dans la catégorie "supérieure", mais avec un peu de recherche, vous pouvez les trouver chez différents fabricants. La seule autre considération à prendre en compte consiste à activer le support ECC dans le BIOS.
Google est sorti sur cette question. Reportez-vous à http://blogs.zdnet.com/storage/?p=638 pour connaître l' impact réel de cette situation sur les systèmes modernes.
la source
Je pense seulement qu’ECC vaut la peine d’être utilisé lorsque le serveur le requiert . Wikipedia :
Je ne trouve pas de source définitive sur Internet, mis à part des affirmations nébuleuses d'une erreur d'un bit par mois par gigaoctet, ce qui est manifestement ridicule; les serveurs planteraient à gauche et à droite partout dans le monde si cela était vrai à distance .
Quelques faits saillants d' un thread MetaFilter des administrateurs de serveur actuels:
Personnellement, je pense qu’ECC est un peu sectaire, mais c’est une police d’assurance raisonnable pour un gros serveur costaud, tant que la prime de coût n’est pas trop élevée.
la source
Nous l'avons envisagé pour les systèmes critiques. Un problème est, comment diable faites-vous la détection d'erreur dans le logiciel pour vérifier votre intégrité de la mémoire, quand le programme utilisé pour exécuter la vérification de l'intégrité de la mémoire peut lui-même être sujet à des erreurs de mémoire ??? En gros, vous ne pouvez pas le faire et cela rend difficile l’analyse / l’atténuation des erreurs en mode défaillance, donc ECC est un mécanisme d’atténuation.
C'est l'un de ces cas où, s'il y a des problèmes, vous pouvez réellement blâmer les rayons cosmiques ;)
la source
Je considérerais ECC RAM pour les applications "critiques". Si une erreur de serveur vous faisait perdre d'importantes sommes d'argent (ou tuer des gens, ou que ce soit autre chose), relevez le rôle du pilon ECC. Fondamentalement, pesez le coût du bélier ECC par rapport à ce que vous risquez de perdre en cas d'erreur.
Mais quoi que vous décidiez, je vous recommande d'exécuter MemTest86 + pendant la nuit (ou suffisamment longtemps pour effectuer plusieurs passages sur tout l'espace d'adressage). Et si vous pouvez augmenter la température (littéralement), cela vous donnera une idée de la performance de votre bélier lorsque le système est chaud.
J'ai eu de toutes nouvelles erreurs d'exposition RAM dans MemTest. J'ai également eu de "bonnes" erreurs de développement de mémoire RAM détectées par MemTest au fil du temps. C'est un excellent outil, et l'une des premières choses que je lance sur un nouveau système.
la source