Soit une distribution conjointe de deux variables catégorielles , avec . Supposons que échantillons ont été tirés de cette distribution, mais nous ne recevons que les comptes marginaux, à savoir pour :
Quel est l'estimateur du maximum de vraisemblance pour , étant donné ? Est-ce connu? Calculable? Existe-t-il d'autres approches raisonnables à ce problème que le ML?
maximum-entropy
Réponses:
Ce type de problème a été étudié dans l'article «Augmentation des données dans les tables de contingence multivoie avec des totaux marginaux fixes» de Dobra et al (2006). Soit les paramètres du modèle, soit la table des nombres entiers non observée pour chaque paire , et soit l'ensemble des tables entières dont les nombres marginaux sont égaux . La probabilité d'observer les dénombrements marginaux est alors: oùn ( x , y ) C ( S , T ) ( S , T ) ( S , T ) p ( S , T | θ ) = ∑ n ∈ C ( S , T ) p ( n | θ ) p ( n | θ ) n θ θθ n (x,y) C(S,T) (S,T) (S,T)
Une approche différente utiliserait des méthodes variationnelles pour approximer la somme sur . Les contraintes marginales peuvent être encodées sous forme de graphe factoriel et l'inférence sur peut être effectuée en utilisant la propagation des attentes. θn θ
Pour voir pourquoi ce problème est difficile et n'admet pas de solution triviale, considérons le cas . En prenant comme somme des lignes et comme somme des colonnes, deux tables de comptage sont possibles: Par conséquent, la fonction de vraisemblance est Le MLE pour ce problème est ce qui correspond à supposer le tableau de gauche. En revanche, l'estimation que vous obtiendriez en supposant l'indépendance est S T [ 0 1 2 0 ]S=(1,2),T=(2,1) S T
la source
Comme l'a souligné @Glen_b, cela n'est pas suffisamment spécifié. Je ne pense pas que vous puissiez utiliser le maximum de vraisemblance à moins que vous ne puissiez spécifier entièrement la vraisemblance.
Si vous vouliez assumer l'indépendance, le problème est assez simple (d'ailleurs, je pense que la solution serait la solution d'entropie maximale qui a été suggérée). Si vous ne voulez pas ou ne pouvez pas imposer de structure supplémentaire à votre problème et que vous souhaitez toujours une sorte d'approximation des valeurs des cellules, vous pouvez utiliser les limites de copule Fréchet – Hoeffding . Sans hypothèses supplémentaires, je ne pense pas que vous puissiez aller plus loin.
la source
Edit: Cette réponse est basée sur une hypothèse incorrecte selon laquelle la probabilité des dénombrements marginaux donnés n'est qu'une fonction des probabilités marginales et . J'y pense toujours.px,y px=∑ypx,y py=∑xpx,y
Les mauvaises choses suivent:
Comme mentionné dans un commentaire, le problème avec la recherche de «l'estimateur du maximum de vraisemblance pour est qu'il n'est pas unique. Par exemple, considérons le cas avec binaires et les marginaux . Les deux estimateurspx,y X,Y S1=S2=T1=T2=10
ont les mêmes probabilités marginales et dans tous les cas, et ont donc des probabilités égales (qui maximisent toutes deux la fonction de vraisemblance, comme vous pouvez le vérifier).px py
En effet, quels que soient les marginaux (tant que deux d'entre eux sont non nuls dans chaque dimension), la solution du maximum de vraisemblance n'est pas unique. Je vais le prouver pour le cas binaire. Soit une solution de vraisemblance maximale. Sans perte de généralité, supposons . Alors a les mêmes marginaux et est donc aussi une solution de vraisemblance maximale.p=(acbd) 0<a≤d p=(0c+ab+ad−a)
Si vous souhaitez en outre appliquer une contrainte d'entropie maximale, vous obtenez une solution unique qui, comme l'a déclaré F. Tussell, est la solution dans laquelle sont indépendants. Vous pouvez voir ceci comme suit:X,Y
L'entropie de la distribution est ; maximisation sous réserve de et (de manière équivalente, où et ) en utilisant les multiplicateurs de Lagrange donne l'équation:H(p)=−∑x,ypx,ylogpx,y ∑xpx,y=py ∑ypx,y=px g⃗ (p)=0 gx(p)=∑ypx,y−px gy(p)=∑xpx,y−py
Tous les gradients de chaque sont 1, donc en coordonnées cela àgk
plus les contraintes d'origine et . Vous pouvez vérifier que cela est satisfait lorsque et , donnant∑ y p x , y∑xpx,y=py ∑ypx,y=px e1/2−λx=px e1/2−λy=py
la source