Disons que j'ai une densité normale multivariée de . Je veux obtenir le deuxième dérivé (partiel) wrt \ mu . Pas sûr de savoir comment prendre dérivé d'une matrice.
Le wiki dit prendre le dérivé élément par élément à l'intérieur de la matrice.
Je travaille avec l'approximation de Laplace Le mode est .Θ = μ
On m'a donné comment est-ce arrivé?
Ce que j'ai fait:
Donc, je prends dérivé de , premièrement, il y a une transposition, deuxièmement, c'est une matrice. Donc, je suis coincé.
Note: Si mon professeur rencontre ceci, je me réfère à la conférence.
self-study
normal-distribution
matrix
utilisateur1061210
la source
la source
Réponses:
Dans le chapitre 2 du livre de recettes matricielles, vous trouverez un aperçu des éléments de calcul matriciel qui donne de nombreuses identités utiles pour résoudre les problèmes rencontrés lors de la réalisation de probabilités et de statistiques, y compris des règles permettant de différencier la vraisemblance gaussienne multivariée.
Si vous avez un vecteur aléatoire multivarié normal avec un vecteur moyen et une matrice de covariance , utilisez l'équation (86) dans le livre de recettes matriciel pour déterminer que le gradient de la vraisemblance du journal par rapport à estμ Σ L μy μ Σ L μ
Je vous laisse le soin de différencier à nouveau cette question et de trouver la réponse .- Σ- 1
En tant que "crédit supplémentaire", utilisez les équations (57) et (61) pour déterminer que le gradient par rapport à estΣ
J'ai omis beaucoup d'étapes, mais j'ai fait cette dérivation en utilisant uniquement les identités trouvées dans le livre de recettes de la matrice. Je vous laisse donc le soin de combler les lacunes.
J'ai utilisé ces équations de score pour l'estimation du maximum de vraisemblance, je sais donc qu'elles sont correctes :)
la source
Vous devez vous assurer que vous prenez bien en compte les éléments répétés dans , sinon vos dérivés seront incorrects. Par exemple, (141) le livre de recettes matriciel donne pour un symétrique les dérivés suivantsΣΣ Σ
Et (14) de Différenciation des fonctions des matrices de covariance donne
où désigne le produit Hadmard et pour plus de commodité, nous avons défini .x : = y - μ∘ x:=y−μ
Notez en particulier que ce n'est pas la même chose que lorsque la symétrie de n'est pas imposée. En conséquence, nous avons ceΣ
où désigne la dimension de , et et la dérivée deest 0x y μ D log | 2 π |D x y μ Dlog|2π|
Cela garantit que l' élément de correspond à .∂ Li,jth dela L∂L∂Σ ∂L∂Σij
la source
J'ai essayé de vérifier informatiquement la réponse de @ Macro mais j'ai trouvé ce qui semble être une erreur mineure dans la solution de covariance. Il a obtenu Cependant, il semble que la solution correcte soit réellement Le script R suivant fournit un exemple simple dans lequel la différence finie est calculée pour chaque élément de . Cela démontre queB=2A-diag(A)ΣAB
la source