Géométrie algébrique pour les statistiques

8

J'ai entendu parler des utilisations de la géométrie algébrique en statistique et en apprentissage automatique. Je voulais essayer d'en apprendre un peu plus sur ces sujets. Je ne connais presque rien de la géométrie algébrique, mais j'ai une formation en mathématiques et je connais la théorie des groupes de base, les champs d'anneaux et certaines algèbres commutatives. Mes questions sont:

  1. Quels sont les concepts géométriques algébriques que je devrais apprendre qui sont liés aux applications dans Stats / ML (je suppose qu'une partie seulement de ce qui est habituellement enseigné dans les cours et les livres géométriques algébriques est utile).

  2. Pouvez-vous recommander des livres / documents d'introduction à quelqu'un avec mes antécédents? Je ne parle pas de manuels standard pour AG mais de quelque chose qui se concentre sur les concepts utilisés dans les applications.

sjm.majewski
la source
3
Vous pourriez commencer par M. Drton, B. Sturmfels et S. Sullivant, Lectures on Algebraic Statistics , Springer, 2009.
Cardinal

Réponses:

11

Voici une liste des références standard:

Voici une liste de références connexes, ne traitant pas directement des statistiques algébriques, bien que fournissant un contexte dans la méthodologie utilisée pour le sujet:

Pages Web de cours sur le sujet, passé et présent:

Ces listes ne sont certainement pas exhaustives.

Chill2Macht
la source
5

entrez la description de l'image ici

Bien sûr d'être influent, ce livre jette les bases de l'utilisation de la géométrie algébrique dans la théorie de l'apprentissage statistique. De nombreux modèles statistiques et machines d'apprentissage largement utilisés appliqués aux sciences de l'information ont un espace de paramètres qui est singulier: les modèles de mélange, les réseaux de neurones, les HMM, les réseaux bayésiens et les grammaires sans contexte stochastiques en sont des exemples majeurs. La géométrie algébrique et la théorie de la singularité fournissent les outils nécessaires pour étudier de tels modèles non lisses. Quatre formules principales sont établies:

  1. la fonction de vraisemblance logarithmique peut recevoir une forme standard commune en utilisant la résolution des singularités, même appliquée à des modèles plus complexes;

  2. le comportement asymptotique de la vraisemblance marginale ou «l'évidence» est dérivé basé sur la théorie de la fonction zêta;

  3. de nouvelles méthodes sont dérivées pour estimer les erreurs de généralisation dans les estimations de Bayes et Gibbs à partir d'erreurs d'entraînement;

  4. les erreurs de généralisation du maximum de vraisemblance et les méthodes a posteriori sont clarifiées par la théorie des processus empiriques sur les variétés algébriques.

Rodrigo de Azevedo
la source
Merci pour la référence - ce livre ressemble à la meilleure recommandation jusqu'à présent! Je vais devoir l'obtenir bientôt. Aussi pour toute personne intéressée ici est une question sur ce site à propos de ce livre: stats.stackexchange.com/questions/22391/…
Chill2Macht