La mathématique a ses fameux problèmes du millénaire (et, historiquement, les 23 de Hilbert ), des questions qui ont contribué à façonner la direction du terrain.
Cependant, je ne sais pas ce que seraient les hypothèses de Riemann et les statistiques P vs NP.
Alors, quelles sont les questions ouvertes globales dans les statistiques?
Édité pour ajouter: À titre d'exemple de l'esprit général (sinon assez spécifique) de la réponse que je recherche, j'ai trouvé une conférence inspirée par "Hilbert's 23" de David Donoho lors de la conférence "Les défis mathématiques du 21e siècle": Analyse de données de grande dimension: les malédictions et les bénédictions de la dimensionnalité
Une réponse potentielle pourrait donc parler du big data et de son importance, des types de défis statistiques que posent les données haute dimension, ainsi que des méthodes à développer ou des questions auxquelles il faut répondre pour aider à résoudre le problème.
Réponses:
Une grande question devrait concerner des questions clés de méthodologie statistique ou, étant donné que les statistiques concernent uniquement des applications, elle devrait concerner la manière dont les statistiques sont utilisées avec des problèmes importants pour la société.
Cette caractérisation suggère que les éléments suivants devraient être inclus dans toute prise en compte de gros problèmes:
Quelle est la meilleure façon de mener des essais de médicaments ? Actuellement, les tests d'hypothèses classiques nécessitent de nombreuses phases d'étude formelles. Dans les phases ultérieures (de confirmation), les questions économiques et éthiques pèsent lourd. Pouvons-nous faire mieux? Devons-nous inclure des centaines, voire des milliers de malades dans des groupes de contrôle et les y maintenir jusqu'à la fin d'une étude, par exemple, ou pouvons-nous trouver de meilleurs moyens d'identifier les traitements qui fonctionnent réellement et de les transmettre aux membres de l'essai (et les autres) plus tôt?
Faire face au biais de publication scientifique . Les résultats négatifs sont publiés beaucoup moins simplement parce qu'ils n'atteignent tout simplement pas une valeur p magique. Toutes les branches de la science doivent trouver de meilleurs moyens de mettre en lumière des résultats scientifiquement importants, et pas seulement statistiquement significatifs . (Le problème des comparaisons multiples et la gestion des données de grande dimension sont des sous-catégories de ce problème.)
Explorer les limites des méthodes statistiques et leurs interfaces avec l'apprentissage et la cognition automatiques . Les progrès inévitables de la technologie informatique rendront la véritable IA accessible de notre vivant. Comment allons-nous programmer des cerveaux artificiels? Quel rôle la pensée statistique et l'apprentissage statistique pourraient-ils jouer dans la création de ces avancées? Comment les statisticiens peuvent-ils aider à réfléchir sur la cognition artificielle, l'apprentissage artificiel, à explorer leurs limites et à faire des progrès?
Développer de meilleures méthodes d'analyse des données géospatiales . On prétend souvent que la majorité, ou la grande majorité, des bases de données contiennent des références de localisation. Bientôt, de nombreuses personnes et appareils seront localisés en temps réel grâce aux technologies GPS et de téléphonie mobile. Les méthodes statistiques d'analyse et d'exploitation des données spatiales en sont encore à leurs balbutiements (et semblent être reléguées aux SIG et aux logiciels spatiaux généralement utilisés par des non-statisticiens).
la source
Michael Jordan a publié un court article intitulé Quels sont les problèmes non résolus dans la statistique bayésienne? , dans lequel il a interrogé un groupe de statisticiens pour connaître leur point de vue sur les problèmes en suspens dans le domaine des statistiques. Je vais résumer (alias, copier-coller) un peu ici, mais il vaut probablement mieux simplement lire l'original.
Non paramétrique et semiparamétrique
Prieurs
Relations bayésiennes / fréquentistes
Calcul et statistiques
Sélection de modèles et tests d'hypothèses
la source
Je ne sais pas trop quelle est leur taille, mais il existe une page Wikipedia pour les problèmes non résolus dans les statistiques. Leur liste comprend:
la source
Comme exemple de l'esprit général (sinon assez spécifique) de réponse que je recherche, j'ai trouvé une conférence inspirée par "Hilbert's 23" de David Donoho lors d'une conférence intitulée "Les défis mathématiques du 21e siècle":
Analyse de données de grande dimension: les malédictions et les bénédictions de la dimensionnalité
la source
Mathoverflow a une question similaire sur les gros problèmes de la théorie des probabilités .
Il semblerait, à partir de cette page, que les plus grandes questions portent sur l’auto-évitement des marches et des percolations aléatoires.
la source
Vous pouvez consulter le colloque «Les problèmes difficiles en sciences sociales à Harvard » tenu plus tôt cette année. Plusieurs de ces discussions présentent des problèmes d'utilisation des statistiques et de modélisation en sciences sociales.
la source
Ma réponse serait la lutte entre la statistique fréquentiste et la statistique bayésienne. Quand les gens vous demandent en quoi vous "croyez", ce n'est pas bon! Surtout pour une discipline scientifique.
la source