Pourquoi l'utilisation peu fréquente des techniques d'apprentissage automatique en biomédecine translationnelle?

8

Ceci fait suite à une question précédente. ici :

Modèle de réseau neuronal pour prédire le résultat du traitement

et pourrait être considéré comme se référant à un aspect différent de cette question:

Application des techniques d'apprentissage automatique à de petits échantillons d'études cliniques

Merci à Zach qui a suggéré de republier.

J'ai mis une lecture assez sérieuse sur CART, randomForest, Neural Networks et l'apprentissage automatique en général, j'ai appris sur WEKA et les packages R, vu et suivi les conférences d'ingénierie de Stanford http://www.ml-class.org/ cours / classe / index, Je suis 3 chapitres dans Hastie. Compte tenu du type de données que nous voyons régulièrement dans la recherche orientée vers la clinique - charges de paramètres cliniques + charges de paramètres biochimiques + données de test sur stylo et papier +/- données de neuroimagerie avec de petits nombres, j'ai l'impression que je manque quelque chose. Je ne lis pas régulièrement sur les techniques de ML appliquées dans la littérature de recherche. Ma question est la suivante: ai-je juste accroché à quelque chose qui est douteux et donc considéré avec une suspicion justifiée par des cliniciens et des biostatisticiens qui en sont bien conscients, ou ces techniques sont-elles véritablement ignorées ou redoutées en dehors de "l'analyse commerciale"? Qu'est-ce qui la maintient "en niche"?

Rosser
la source
Je pense que le problème ici est plus lié aux journaux que vous lisez qu'autre chose. L'apprentissage automatique est assez largement appliqué en médecine translationnelle moderne, à condition que les modèles à boîte noire soient acceptables pour la tâche.
Marc Claesen

Réponses:

8

Les techniques d'apprentissage automatique manquent souvent d'interprétabilité. En outre, ils ont tendance à être plutôt grossiers d'un point de vue statistique --- par exemple, les réseaux de neurones ne font aucune hypothèse sur les données d'entrée. J'ai le sentiment que beaucoup de gens (surtout s'ils ont une solide formation statistique) les regardent de haut.

bayerj
la source
Ouais, je pense que j'ai compris. Cependant, de mon point de vue, les méthodes statistiques ne sont ni pures ni sales, juste l'application de la logique aux données. Si vous voulez qu'une pilule guérisse quelque chose, vous devez comprendre les interrelations et apporter cela au laboratoire de biologie moléculaire. Cependant, si vous voulez simplement faire une prédiction en utilisant des méthodes de boîte noire (NN / RF) ou de décision (CART), quel est le problème? Vous pourriez même avoir un aperçu. Est-ce plus profond que le snobisme?
Rosser
Bien que l'interprétabilité soit certainement agréable, je ne sais pas si je consulterais un médecin qui sait ce qu'il fait et a un taux de réussite de 60% par rapport à un médecin qui n'a aucun indice mais a un taux de réussite de 100%;)
blubb
1
Vous pourriez être intéressé par «Modélisation statistique de Leo Breiman - Les deux cultures», où cela est couvert en profondeur ( reconnaissance.su/wiki/images/8/85/Breiman01stat-ml.pdf ). En outre, il y a des raisons pour cette approche - - si vous voulez que les humains interprètent des choses, par exemple.
bayerj
@blubb Je consulterais un médecin qui n'a aucun indice mais un taux de réussite de 100% avec un intervalle de confiance [98,100] :)
Simone
4

Le bilan de l'apprentissage automatique en biomédecine n'a pas été très bon. Les premiers succès de l'apprentissage automatique ont été obtenus dans des domaines de reconnaissance des formes à rapport signal / bruit élevé tels que la reconnaissance visuelle des formes. Le rapport S: N est beaucoup plus faible en biologie et en sciences sociales. L'apprentissage automatique s'adapte efficacement à de nombreuses interactions entre les prédicteurs, et pour ce faire, vous devez avoir une taille d'échantillon énorme ou un rapport S: N très élevé. Voir La médecine est-elle hypnotisée par l'apprentissage automatique? . En outre, de nombreux praticiens de l'apprentissage automatique ont mal compris les tâches de prédiction comme des tâches de classification. Voir ici pour en savoir plus.

Frank Harrell
la source