Note rapide: Je sais que c'est un site de questions-réponses sur le développement de jeux , mais je suppose que vous connaissez et avez surtout de l'expérience avec les cartes graphiques, je vous adresse donc cette question. Si vous pensez que c'est complètement hors sujet, veuillez me référer à un site / forum approprié. Edit: En fait, cela est lié à gamedev: si un mauvais code peut entraîner une surchauffe ou une rupture de la carte, les développeurs de jeux doivent en être conscients et s'assurer que leurs applications ne le font pas.
Cela peut sembler une question étrange ou stupide, mais est-il réellement possible d'écrire une telle application de rendu graphique qui peut casser la carte graphique (de quelque manière que ce soit)?
La raison immédiate qui m'a fait poser cette question était (sans surprise) ma propre carte graphique cassée. Après l'avoir réparé, le militaire a déclaré qu'il avait testé diverses applications (jeux) et que cela fonctionnait bien. Mais lorsque j'ai lancé ma propre application (démonstration d'ombrage différé), elle l'a chauffée à plus de 100 degrés Celsius. Donc, ma carte ne s'est pas révélée être réparée après tout, mais ce qui est important ici, c'est que le problème ne semble se produire que lorsque j'exécute ma propre application.
J'ai joué à divers jeux exigeants en GPU (comme Crysis) et je l'ai souvent poussé à la limite et plus encore (avec des réglages si élevés que les jeux tournaient à 5 FPS), ainsi que des repères ... J'ai donc donné ma carte, à plusieurs reprises, tellement de charge de travail qu'elle ne pouvait pas rattraper (donc faible FPS) mais elle n'a jamais atteint des températures dangereuses. Mais ma propre application a réussi à y parvenir (au moins lorsque la v-sync était désactivée). : P Comme ce n'était que ma propre application, je ne pense pas qu'un mauvais système de refroidissement soit le coupable.
Je demande donc - pensez-vous (ou savez-vous peut-être) s'il est possible de casser la carte graphique (de quelque manière que ce soit, pas seulement en surchauffant) par un code vicieux?
Mise à jour:
Joe Swindell a déclaré que la surchauffe peut être le problème (eh bien, cela peut certainement casser la carte). Mais un système de refroidissement approprié ne devrait-il pas empêcher cela (en aucun cas)?
Boreal a signalé un autre problème. Si je comprends bien, FPS est lié à la fois au CPU et au GPU (est-ce vrai?). Un FPS si faible peut signaler une charge CPU élevée ou une charge GPU élevée. Mais encore une fois - un système de refroidissement approprié ne devrait-il pas empêcher le GPU de surchauffer même si la carte est "utilisée à 100% tout le temps"?
Réponses:
Ce n'est pas la responsabilité de l'application de s'assurer que le GPU ne surchauffe pas, et ce n'est pas la faute de l'application si elle surchauffe.
Si le GPU n'a pas un refroidissement approprié, alors oui, l'exécution d'une application 3D peut la chauffer à des niveaux dangereux. Je ne sais pas pourquoi votre application le fait et Crysis non, mais cela signifie que la carte a un refroidissement inadéquat et / ou qu'elle a été endommagée (overclocké ou autres paramètres / pilotes d'usine modifiés).
Outre la surchauffe, je ne connais aucune autre manière dont un logiciel pourrait endommager physiquement la puce sur laquelle il fonctionne. Ce n'est vraiment pas censé être possible; ce serait un très grave échec de conception.
la source
C'est arrivé dans la nature.
Starcraft II en 2010 avait un problème où il y avait un framerate non plafonné sur les écrans de menu plaçant une charge étrange sur les cartes graphiques, détruisant les cartes de certains fournisseurs avec une protection thermique insuffisante.
Les défauts de conception et de fabrication du GPU lui-même peuvent également entraîner le démontage de la carte sous charge. Les GPU mobiles G84 / G86 avaient des joints de soudure qui se sont cassés sous des charges de température acceptables et se sont finalement cassés. Nous avons également le fameux Red Ring of Death de la XBox 360 qui a des problèmes thermiques similaires avec la soudure et l'expansion.
Tous ces éléments sont un mélange de défauts matériels et de conceptions thermiques insuffisantes, amplifiés par la charge logicielle.
la source
Votre question est beaucoup plus complexe que ce que vous avez écrit. Je dirais que la question générale est "le logiciel peut-il casser le matériel?", Et la réponse à cette question est définitivement oui.
Attention, tous les matériels ne peuvent théoriquement pas être cassés via des commandes logicielles, mais finalement, ce que fait le logiciel est d'envoyer des signaux électriques à des composants matériels très délicats. Habituellement, plus un composant matériel est délicat, plus il est probable qu'il soit endommagé lorsqu'il est manipulé d'une manière qui n'a pas été conçue.
Il existe de nombreuses façons amusantes de casser le matériel, mais considérons simplement la surchauffe: le travail de traitement génère de la chaleur, et cette chaleur doit aller quelque part. En fonction des caractéristiques de dissipation de votre carte, du débit d'air dans le boîtier et de la température globale de la pièce, la quantité de chaleur évacuée du système peut être plus ou moins importante que ce qui est généré par celle-ci.
Si vous demandez à la carte vidéo d'effectuer un travail qui génère plus de chaleur que ce qui peut être efficacement dissipé, la température de la puce augmentera. Si vous le maintenez, la température augmentera au-dessus du niveau de fonctionnement sûr et la puce se brisera, perdra sa fumée magique et provoquera probablement même un risque d'incendie. Vous venez de casser votre carte vidéo, j'espère que vous êtes content.
Maintenant, pouvez- vous écrire un logiciel qui fait cela? Je dirais que non. Tout programme (de niveau utilisateur) que vous écrivez ne parlera pas directement à la carte vidéo. Il existe de nombreuses protections conçues pour éviter cette situation, et elles doivent toutes échouer, de sorte que votre programme de rendu finit par brûler votre maison.
En règle générale, les dissipateurs de chaleur et les ventilateurs sont conçus de manière à ce qu'ils puissent éliminer confortablement la quantité maximale de chaleur que la carte générera, même dans des boîtiers mal ventilés sous des climats chauds (dans les plages de fonctionnement spécifiées par le fabricant).
Si la génération de chaleur est supérieure à la dissipation thermique, la première ligne de défense serait le conducteur. La plupart des pilotes vérifieront la température centrale du GPU, et si elle augmente, le pilote peut limiter la quantité d'instructions qu'il envoie au GPU pour éviter de générer plus de chaleur.
En cas d'échec, le micrologiciel de la carte graphique devrait détecter que la chaleur s'accumule dangereusement et réduira donc la vitesse d'horloge afin de réduire la génération de chaleur.
Si après tout cela, la chaleur continue de s'accumuler, une diode thermique disponible dans la plupart des processeurs et GPU modernes arrêtera complètement la carte vidéo et la génération de chaleur s'arrêtera.
Donc, si vous voulez casser votre carte vidéo coûteuse d'une application de niveau utilisateur via une surchauffe, en plus de créer un logiciel qui sollicite le système au maximum, vous aurez besoin de:
Un système de dissipation de chaleur défectueux ou cassé. Il suffit de coller votre doigt dans le ventilateur (toujours au centre, pas dans les pales) devrait faire l'affaire. Difficulté: facile
Un pilote personnalisé (ou buggé) avec des fonctionnalités de limitation désactivées ou cassées. Difficulté: normale
Un firmware personnalisé avec des fonctionnalités de réduction d'horloge désactivées ou cassées. Difficulté: difficile
Une diode thermique cassée. Si vous déclenchez constamment la diode thermique, elle peut être endommagée. Difficulté: très difficile
... mais pas impossible! N'hésitez pas à l'essayer *, mais assurez-vous de garder le téléphone de votre service d'incendie à portée de main lorsque vous le faites.
*: C'est du sarcasme. Je ne tolère en aucun cas la création d'un risque d'incendie ou toute activité qui pourrait vous nuire à vous, votre famille, votre chien ou votre communauté de quelque façon que ce soit. En lisant cet article, vous me dégagez complètement de toute responsabilité que vos actions pourraient entraîner.
la source
Même avec VSYNC désactivé, de nombreux jeux peuvent ne pas atteindre même 98% d'utilisation du GPU. Plus ils mettent en œuvre un gameplay réel, moins ils peuvent mettre en scène d'images et plus le GPU risque d'être sous-utilisé. De bons jeux multi-core optimisés peuvent se rapprocher considérablement de l'utilisation à 100% du GPU, mais généralement la logique de jeu garde le processeur suffisamment occupé avec d'autres tâches qu'il n'est pas en mesure de saturer le GPU avec une charge de travail complète. Les applications de rendu pur peuvent facilement atteindre 100% de charge GPU, mais les jeux font bien plus que le rendu.
Sur une note latérale, sur ma machine domestique, mon GPU génère un EMI important sous une charge élevée et il interfère avec l'audio intégré bon marché sur ma carte mère. Je peux entendre un gémissement aigu sur l'audio analogique dont la fréquence varie avec la charge. J'en suis venu à apprécier cela et à le considérer comme une fonctionnalité plutôt qu'un défaut de conception, cela rend le profilage intéressant car je peux réellement entendre le niveau de charge sans avoir à échantillonner un compteur de performances GPU. Cependant, je suppose que si vous avez un appareil très sensible aux interférences électromagnétiques et mal protégé, cela pourrait être un problème ... une charge élevée du GPU pourrait provoquer une défaillance dans un autre appareil.
la source
La surchauffe EST en train de casser votre carte graphique. Lancer une énorme boucle de données qu'il ne peut pas gérer va certainement, comme vous l'avez vu, planter et éventuellement endommager votre carte de façon permanente.
la source
Oui il peut.
Peut être évité avec de bons systèmes de refroidissement. L'activation de la synchronisation V est également un bon moyen d'éviter cela. V-sync empêche le GPU de sortir des images à une vitesse plus rapide que le moniteur ne peut gérer, qui sont des images qui sont normalement supprimées, pour ne jamais être vues.
Moins d'images = moins de traitement = moins de charge de travail extrême.
Il est également important de garder une trace des capacités du GPU. J'imagine que les programmeurs de Crytek ont écrit le code pour être prêt à ce que quelqu'un surestime leurs capacités de cartes graphiques. S'ils l'ont fait, je suis sûr que c'est une fonctionnalité qui a sauvé de nombreux GPU et a épargné à de nombreux propriétaires de GPU ignorants de la frustration.
Peut être évité avec un codage soigneux et une double vérification au moment de l'exécution. (Mais il y a toujours des bugs. S'il n'y en a pas, c'est parce qu'ils jouent avec vous.)
Cela peut être évité avec un codage soigneux et une double vérification au moment de l'exécution.
la source
Réponse en un mot: OUI.
Réponse détaillée: oui. Cela peut (dans certaines situations). Imaginez que vous écrivez un programme qui transfère considérablement les données de votre GPU vers une boucle infinie. Il est certain qu'il va surchauffer. Maintenant, n'est-ce pas la responsabilité de son système de refroidissement de s'en occuper? Bien sûr que oui. Mais vous devez également vous rappeler que le système de refroidissement a également certains niveaux de seuil. Si la chaleur produite est hors de la plage de fonctionnement de votre système de refroidissement, alors votre système de refroidissement est à peine utile. Je ne sais pas ce que fait votre application, mais en parlant du point de vue des programmeurs, vous pouvez écrire de tels programmes, ce qui conduit à ce genre de situation.
la source
L'installation d'un pilote non compatible avec la carte utilisée peut facilement entraîner des dommages permanents. Mon ami a réussi à le faire grâce à la réinstallation répétitive du système d'exploitation et au changement physique du disque dur.
Allumez et éteignez votre PC plusieurs fois. Je ne sais pas si cela peut provoquer un échec, mais c'est très possible. Quoi qu'il en soit, cela ne semble pas être un
software
moyen de le faire.Manipulez le niveau d'alimentation du système en allumant et éteignant les périphériques USB consommateurs d'énergie (exemple: disque dur externe qui n'utilise pas sa propre alimentation). Faire cela rend toujours mon clavier et ma souris inutilisables jusqu'au prochain redémarrage et il a (plus de 2 ans de branchement et de déconnexion quotidiens de 3 disques durs) brûlé plusieurs cellules dans l'une de mes puces RAM, ce qui a entraîné un BSOD toutes les 10-20 minutes.
la source
Mon expérience personnelle:
J'avais un Lenovo Thinkpad T61p avec un Quadro FX570M construit vers août 2008, ce lot était connu pour avoir des GPU défectueux qui échoueraient un jour ou l'autre (le soudage était sous-optimal sur certaines des broches du GPU.)
Tout allait bien pendant environ 5 ans jusqu'à ce que j'exécute XCOM The Bureau (un jeu connu pour ne pas être vraiment optimisé), l'ordinateur portable était chaud, les fans à pleine vitesse et pendant environ 1 heure de jeu, il a gelé mais pas un gel habituel .
Devine quoi ? J'ai éteint et rallumé l'ordinateur portable, il était mort avec les codes sonores appropriés du BIOS indiquant une panne vidéo.
Pour répondre à votre question : oui (comme d'autres l'ont souligné), un logiciel peut définitivement casser du matériel si le premier n'est pas protégé d' une manière ou d'une autre ; si, par exemple, le ventilateur du GPU est éteint, il explosera définitivement avec 100% de chances de succès: D
la source
J'avais une fois une carte graphique GeForce 4 MX 440 et je voulais jouer à Prince of Persia: sands of time. Mais le jeu ne s'est pas lancé car il n'a pas pu trouver le support Pixel Shader attendu. C'était un peu inattendu pour moi, car le dernier Prince of Persia: Warrior Within a très bien fonctionné.
Donc, à la fin, j'ai trouvé un analyseur 3D ( http://www.tommti-systems.com/main-Dateien/files.html ) et j'ai forcé le jeu à fonctionner et à jouer au jeu pendant plusieurs jours. Après quelques jours, ma carte vidéo s'est cassée - n'affichait plus rien. J'ai eu le nouvel ordinateur pendant environ 5-6 mois, donc je pense que forcer le jeu à fonctionner de cette façon a en fait cassé ma carte vidéo :(
la source
Oui, j'en ai cassé quelques-uns. Je ne lance plus d'applications de calcul de grille GPU. Certaines applications ont tendance à les casser, en particulier lorsque la machine passe en mode veille, mais dans des situations normales lorsque les ventilateurs fonctionnent / le liquide de refroidissement circule, il ne devrait pas y avoir de problèmes à moins que le refroidissement ne soit pas trop petit.
la source
Cela peut se produire si le circuit de la carte est court-circuité, mais il est très peu probable que cela se produise car le système est isolé jusqu'à une certaine température élevée. Dans certains cas, le système thermodynamique de la carte peut être perturbé si elle est vraiment proche d'un autre système ou si elle touche même un autre matériau qui n'est pas un système.
la source
sendShortCircuit
, car un tel court-circuit serait un défaut avec la carte graphique. Le logiciel n'en serait pas responsable. Cette question est de savoir si, par exemple, les cartes graphiques sont notées "100% d'utilisation jusqu'à 1 seconde, 90% d'utilisation moyenne à long terme" et le logiciel a été obligé de ne pas dépasser cette note