Ceci fait suite à une question précédente. ici :
Modèle de réseau neuronal pour prédire le résultat du traitement
et pourrait être considéré comme se référant à un aspect différent de cette question:
Application des techniques d'apprentissage automatique à de petits échantillons d'études cliniques
Merci à Zach qui a suggéré de republier.
J'ai mis une lecture assez sérieuse sur CART, randomForest, Neural Networks et l'apprentissage automatique en général, j'ai appris sur WEKA et les packages R, vu et suivi les conférences d'ingénierie de Stanford http://www.ml-class.org/ cours / classe / index, Je suis 3 chapitres dans Hastie. Compte tenu du type de données que nous voyons régulièrement dans la recherche orientée vers la clinique - charges de paramètres cliniques + charges de paramètres biochimiques + données de test sur stylo et papier +/- données de neuroimagerie avec de petits nombres, j'ai l'impression que je manque quelque chose. Je ne lis pas régulièrement sur les techniques de ML appliquées dans la littérature de recherche. Ma question est la suivante: ai-je juste accroché à quelque chose qui est douteux et donc considéré avec une suspicion justifiée par des cliniciens et des biostatisticiens qui en sont bien conscients, ou ces techniques sont-elles véritablement ignorées ou redoutées en dehors de "l'analyse commerciale"? Qu'est-ce qui la maintient "en niche"?
la source
Réponses:
Les techniques d'apprentissage automatique manquent souvent d'interprétabilité. En outre, ils ont tendance à être plutôt grossiers d'un point de vue statistique --- par exemple, les réseaux de neurones ne font aucune hypothèse sur les données d'entrée. J'ai le sentiment que beaucoup de gens (surtout s'ils ont une solide formation statistique) les regardent de haut.
la source
Le bilan de l'apprentissage automatique en biomédecine n'a pas été très bon. Les premiers succès de l'apprentissage automatique ont été obtenus dans des domaines de reconnaissance des formes à rapport signal / bruit élevé tels que la reconnaissance visuelle des formes. Le rapport S: N est beaucoup plus faible en biologie et en sciences sociales. L'apprentissage automatique s'adapte efficacement à de nombreuses interactions entre les prédicteurs, et pour ce faire, vous devez avoir une taille d'échantillon énorme ou un rapport S: N très élevé. Voir La médecine est-elle hypnotisée par l'apprentissage automatique? . En outre, de nombreux praticiens de l'apprentissage automatique ont mal compris les tâches de prédiction comme des tâches de classification. Voir ici pour en savoir plus.
la source