Pendant mon temps libre, je travaille sur un petit système basé sur le Web qui recueille les rapports de plantage (mais pas les autres rapports de bogue non bloquants) qui sont envoyés depuis les applications Windows Delphi.
Pour le dépannage, les utilisateurs aimeraient avoir une fonction d'exploration de données pour trouver des relations entre les versions du matériel ou du système d'exploitation et le bogue et / ou le crash spécifique.
À titre d'exemple, comment cela devrait fonctionner:
- pour chaque crash il y a un rapport dans la base de données, qui a un code d'empreinte digitale / de hachage de la trace de pile (pile d'appel) au moment du crash pour identifier les doublons
- l'algorithme vérifie si tous les doublons d'un rapport de bogue ont également d'autres attributs communs, par exemple un service pack manquant du système d'exploitation
- le résultat de l'analyse répertorie toutes les propriétés communes aux rapports de bogues
Supposons que ces rapports de bogues automatiques contiennent toutes les informations clés telles que les noms de tous les processus en cours d'exécution, les noms de fichiers, les informations de version des DLL chargées, etc.
Comment puis-je trouver des corrélations entre des plantages répétés et l'environnement? Existe-t-il des algorithmes ou des méthodes statistiques spécifiques qui pourraient aider?
Réponses:
Pourriez-vous échantillonner les machines [non bloquées] de votre utilisateur pour les mêmes informations que celles que vous obtenez dans un rapport de plantage? Parce qu'alors, vous pouvez utiliser la régression logistique pour modéliser ces attributs (et interactions) à la probabilité d'obtenir un crash.
la source