Je suis curieux de connaître la nature de . Quelqu'un peut-il dire quelque chose d'intuitif sur "Que dit propos des données?" Σ - 1
Modifier:
Merci pour les réponses
Après avoir suivi d'excellents cours, j'aimerais ajouter quelques points:
- C'est une mesure d'information, c'est-à-dire que est la quantité d'informations le long de la direction .x
- Dualité: Puisque est positif défini, il en est de même de , ce sont donc des normes de produits scalaires, plus précisément deux normes les unes des autres, de sorte que nous pouvons déduire Fenchel dual pour le problème des moindres carrés régularisé, et faire la maximisation par rapport au double problème. Nous pouvons choisir l'un ou l'autre, en fonction de leur conditionnement.Σ - 1
- Espace de Hilbert: Les colonnes (et les lignes) de et couvrent le même espace. Il n’ya donc aucun avantage (autre que lorsque l’une de ces matrices est mal conditionnée) entre une représentation avec ou Σ Σ - 1 Σ
- Statistiques bayésiennes: la norme de joue un rôle important dans les statistiques bayésiennes. C'est-à-dire qu'il a déterminé la quantité d'informations dont nous disposons auparavant, par exemple, lorsque la covariance de la densité antérieure ressemble à nous avons une information non informative (ou probablement antérieure à Jeffreys).
- Statistiques fréquentistes: Il est étroitement lié aux informations de Fisher, utilisant la borne Cramér – Rao. En fait, la matrice d’information de pêcheur (produit extérieur du gradient de log-vraisemblance avec lui-même) est liée de Cramér – Rao, c’est-à-dire (par rapport au cône semi-défini positif, à la concentration de iewrt ellipsoïdes). Ainsi, lorsque l'estimateur de vraisemblance maximum est efficace, c'est-à-dire que le maximum d'informations existe dans les données, le régime fréquentiste est donc optimal. En termes plus simples, pour certaines fonctions de vraisemblance (notez que la forme fonctionnelle du vraisemblance dépend uniquement du modèle probabiliste qui est censé générer des données, également appelé modèle génératif), le maximum de vraisemblance est un estimateur efficace et cohérent, comme un patron. (désolé de l'avoir trop utilisé)
Réponses:
C’est une mesure de précision tout comme est une mesure de dispersion.Σ
De manière plus élaborée, est une mesure de la façon dont les variables sont dispersées autour de la moyenne (les éléments diagonaux) et de la façon dont elles co-varient avec d'autres éléments variables (les éléments non diagonaux). Plus la dispersion est grande, plus ils sont éloignés de la moyenne et plus ils co-varient (en valeur absolue) avec les autres variables, plus ils ont tendance à se "déplacer ensemble" (dans le même sens ou dans le sens opposé, selon la signe de la covariance).Σ
De même, est une mesure de la densité des variables autour de la moyenne (les éléments diagonaux) et de la mesure dans laquelle elles ne co-varient pas avec les autres variables (les éléments non diagonaux). Ainsi, plus la diagonale est haute, plus la variable est serrée autour de la moyenne. L'interprétation des éléments hors diagonale est plus subtile et je vous renvoie aux autres réponses pour cette interprétation.Σ−1
la source
En utilisant des exposants pour désigner les éléments de l'inverse, est la variance de la composante de la variable qui n'est pas corrélée avec les autres variables , et est la corrélation partielle des variables et , en contrôlant les autres variables.1/σii i p−1 −σij/σiiσjj−−−−−√ i j p−2
la source