Sous mélange de deux distributions normales:
https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions
"Un mélange de deux distributions normales a cinq paramètres à estimer: les deux moyennes, les deux variances et le paramètre de mélange. Un mélange de deux distributions normales avec des écarts-types égaux n'est bimodal que si leurs moyennes diffèrent d'au moins deux fois l'écart-type commun . "
Je cherche une dérivation ou une explication intuitive pour expliquer pourquoi cela est vrai. Je pense que cela peut être expliqué sous la forme d'un test t à deux échantillons:
où est l'écart type groupé.
Réponses:
Cette figure du papier lié dans cet article wiki fournit une belle illustration:
La preuve qu'ils fournissent est basée sur le fait que les distributions normales sont concaves dans une SD de leur moyenne (la SD étant le point d'inflexion du pdf normal, où elle passe de concave à convexe). Ainsi, si vous ajoutez deux pdfs normaux ensemble (dans des proportions égales), alors tant que leurs moyennes diffèrent de moins de deux SD, la somme-pdf (c'est-à-dire le mélange) sera concave dans la région entre les deux moyennes, et donc le maximum global doit se situer exactement entre les deux moyennes.
Référence: Schilling, MF, Watkins, AE et Watkins, W. (2002). La taille humaine est-elle bimodale? The American Statistician, 56 (3), 223-229. doi: 10.1198 / 00031300265
la source
C'est un cas où les images peuvent être trompeuses, car ce résultat est une caractéristique particulière des mélanges normaux : un analogique ne tient pas nécessairement pour les autres mélanges, même lorsque les composants sont des distributions unimodales symétriques! Par exemple, un mélange égal de deux distributions de Student t séparées par un peu moins du double de leur écart-type commun sera bimodal. Pour une réelle compréhension, nous devons faire quelques calculs ou faire appel aux propriétés spéciales des distributions normales.
Choisissez des unités de mesure (en recentrant et en redimensionnant au besoin) pour placer les moyennes des distributions des composants à et pour faire leur unité de variance commune. Soit la quantité de la composante moyenne la plus grande dans le mélange. Cela nous permet d'exprimer la densité du mélange en général comme±μ, μ≥0, p, 0<p<1,
Étant donné que les deux densités de composants augmentent où et diminuent où les seuls modes possibles se produisent où Trouvez-les en différenciant par rapport à et en le mettant à zéro. Effacer tous les coefficients positifs que nous obtenonsx<−μ x>μ, −μ≤x≤μ. f x
L'exécution d'opérations similaires avec la dérivée seconde de et le remplacement de par la valeur déterminée par l'équation précédente nous indiquent que le signe de la dérivée seconde à tout point critique est le signe def e2xμ
Le dénominateur étant négatif lorsque le signe de est celui deIl est clair que lorsque le signe doit être négatif. Dans une distribution multimodale, cependant (parce que la densité est continue), il doit y avoir une antimode entre deux modes quelconques, où le signe n'est pas négatif. Ainsi, lorsque est inférieur à (l'écart-type), la distribution doit être unimodale.−μ<x<μ, f′′ −(1−μ2+x2). μ≤1, μ 1
La séparation des moyennes étant de la conclusion de cette analyse est2μ,
C'est logiquement équivalent à la déclaration de la question.
la source
Commentaire ci-dessus collé ici pour la continuité:
Suite du commentaire:
Code R pour la figure:
la source