AVR se déprogrammant

8

Quelqu'un d'autre a-t-il eu des cas où un AVR a mystérieusement cessé de fonctionner après plusieurs mois, mais sa reprogrammation le ramènerait?

J'exécute un tas d'atmega328 dans le réseau de capteurs sans fil. J'ai maintenant eu 3 fois (en environ un an) quand l'un d'eux vient de cesser de travailler. Je vais y graver à nouveau le programme et il recommencera à fonctionner. Ce n'est pas toujours la même unité, il ne semble donc pas que ce soit une puce défectueuse.

Cela semble être une chose plutôt désastreuse qui empêcherait les gens d'utiliser des AVR, donc c'est évidemment quelque chose à propos de ma situation particulière. Je me demandais simplement si quelqu'un d'autre s'y est heurté et pourrait avoir des conseils.

Je fonctionne à 3,3 V sur les batteries, donc la tension s'affaissera trop bas pour fonctionner une fois tous les deux mois et je dois remplacer les rechargeables. Les modules utilisent le mode veille et la minuterie du chien de garde pour dormir pendant 60 secondes, prendre une lecture, la retransmettre par radio à la station de base, puis de nouveau dormir. Les modules sont compatibles arduino, donc je n'ai pas retourné le bit "ne me laisse pas recréer ce bit".

edebill
la source
Où avez-vous pu identifier le problème? Nous rencontrons des problèmes similaires avec une configuration similaire. Avez-vous déjà lu la mémoire flash "corrompue" et l'avez-vous comparée au contenu HEX d'origine?
Rev1.0

Réponses:

6

Utilisez-vous la DBO? Des choses désagréables peuvent parfois se produire si une puce brunit.

Leon Heller
la source
3
Pour clarifier, edebill devrait utiliser la DBO.
Kevin Vermeer
Ne pas utiliser BoD. Je vais devoir voir pour l'ajouter. Donc, le scénario ici serait que la puce commence à s'agiter alors que la tension devient trop faible et corrompt accidentellement son propre flash?
edebill
@edebill - Sur les PIC, j'ai vu que cela se produit souvent en production lorsque les seuils BORV ne sont pas définis.
J.Polfer du
Qu'est-ce que la DBO? Détection de Brown Out?
Peter Mortensen
2
Oui, c'est la détection de Brown-Out.
Leon Heller
6

Le Brown-Out-Detection est probablement la bonne façon de le faire, mais ...

J'ai eu un seul problème logiciel qui a provoqué des symptômes très similaires, mais beaucoup plus rapidement. Je crois qu'un mauvais C ++ (compilation?) A entraîné une corruption de la pile et la fonction est retournée en dehors du vrai programme, exécutant des instructions aléatoires. Je ne sais pas exactement ce qui s'est passé ensuite, mais la seule façon de le réparer était de reburn le programme (apparemment certaines de ces instructions aléatoires incluaient l'écriture dans la mémoire du programme).

Le bug n'était qu'un destructeur appelé au mauvais moment. Le fait de rendre la variable globale (afin qu'elle ne soit jamais détruite) a résolu le problème. Le problème était très facilement reproductible (il a fallu environ une minute pour se déclencher) et sur une alimentation très régulière. La configuration particulière était Arduino + WaveShield utilisant la bibliothèque WaveHC, mais je pense que cela pourrait arriver à n'importe qui utilisant C ++.

Si vous préférez les langues de bas niveau, j'ai accidentellement fait la même chose dans l'assemblage, mais miraculeusement, cela n'a jamais causé que des problèmes de timing sporadiques: la plupart des instructions font 2 octets de long, mais certaines sont plus longues, et j'ai calculé la distance de saut moi-même et j'ai sauté au milieu d'une instruction de 4 octets. Il s'est réaligné assez rapidement, mais il n'est pas difficile d'imaginer quelque chose comme ça sur un chemin de code rarement utilisé provoquant la folie.

Jack Schmidt
la source
Cela peut également se produire avec des processeurs qui mappent une partie de la mémoire flash dans l'espace mémoire principal. Je sais au moins que les dsPIC et PIC24 le font. Si vous aviez un pointeur corrompu et les bonnes circonstances, vous pourriez remplacer le flash.
Thomas O
3

J'ai également vu des condensateurs de découplage Vcc insuffisants / mal placés / manquants provoquer des effets similaires. Avez-vous un découplage local aussi proche que possible du CI? (Le type de céramique 100nF - 1uF est préféré)

Adam Lawrence
la source
2

Les décharges électrostatiques (ESD) peuvent également entraîner une perte de mémoire des appareils.

Le placement de quelques varistances sur tous les connecteurs externes qui sont exposés peut exposer à ce problème. Je l'ai déjà vu dans certains produits commerciaux basés sur des microcontrôleurs Microchip PIC, ce n'est donc pas inconnu.

Il existe également des varistances pratiques qui font également office de condensateurs de filtrage (de l'ordre de 10 à 150 pF). Consultez ces http://www.tdk.co.jp/tefe02/e9c11_avr.pdf

Ils sont petits, bon marché et protégeront votre appareil. Placez-les aussi près que possible des connecteurs apportant des signaux externes sur la carte et acheminez immédiatement toutes les traces loin des broches du connecteur.

smashtastic
la source
Les varistances ne sont pas pour la protection ESD (elles sont pour la protection des surtensions durant 10 à 100 millisecondes); les diodes internes de l'appareil sont généralement suffisantes, mais dans le cas contraire, l'ajout de diodes à polarisation inverse sur l'un ou l'autre rail (Vdd et GND) fonctionne généralement, soyez prudent car cela ajoute de la capacité à l'IO et peut affecter les choses à grande vitesse .
Thomas O
1
Thomas jette un œil à la base de données TDK, ces appareils sont spécifiquement conçus pour les contre-mesures ESD, et ils ont fait leurs preuves pour fonctionner en production pour les appareils de communication électroniques. Nous testons nos appareils en interne avec jusqu'à 8 kV ESD et ces appareils protègent les autres composants.
smashtastic
Vous avez raison sur la capacité supplémentaire, et cela doit être pris en compte.
smashtastic