Formule sous forme fermée pour la fonction de distribution, y compris l'asymétrie et l'aplatissement?

13

Existe-t-il une telle formule? Étant donné un ensemble de données dont la moyenne, la variance, l'asymétrie et le kurtosis sont connus ou peuvent être mesurés, existe-t-il une formule unique qui peut être utilisée pour calculer la densité de probabilité d'une valeur supposée provenir des données susmentionnées?

babelproofreader
la source
Pour toute distribution normale (gaussienne), l'asymétrie est de car elle est symétrique, et l'excès de kurtosis est également de rapport aux propriétés d'une distribution normale. Pour d'autres distributions, la moyenne, la variance, l'asymétrie et le kurtosis ne suffisent pas à définir la distribution, bien que des exemples puissent généralement être trouvés. 00
Henry
1
@Henry En fait, dans la plupart des familles de distributions de paramètres avec , les quatre premiers moments - qui peuvent être récupérés à partir de la moyenne, de la variance, de l'asymétrie et du kurtosis - sont généralement suffisants pour identifier la distribution. kk4
whuber
@whuber: Cela me semble être légèrement circulaire: restreindre les distributions à une famille où il y a quatre paramètres ou moins, connaître quatre statistiques de la distribution identifie souvent les paramètres. Je suis d'accord. Mais l'un de mes points était essentiellement que sans restriction, il existe différentes possibilités de distribution avec des densités de probabilité sensiblement variables à des points particuliers, même avec les mêmes quatre premiers moments dans l'ensemble.
Henry
1
Je vois ce que vous voulez dire, Henry: par «autres distributions», vous vouliez dire dans un sens largement général, alors que ma réponse le prenait pour le sens des distributions couramment utilisées en statistique (qui ont rarement plus de quatre paramètres). Je pense que votre codicille - "bien que l'on puisse généralement trouver des exemples" - a peut-être suggéré mon interprétation plus étroite.
whuber

Réponses:

12

Il existe de nombreuses formules de ce type. La première tentative réussie de résoudre précisément ce problème a été faite par Karl Pearson en 1895, menant finalement au système de distributions de Pearson . Cette famille peut être paramétrée par la moyenne, la variance, l'asymétrie et le kurtosis. Il comprend, comme cas spéciaux familiers, les distributions Normal, Student-t, Chi-square, Gamma inverse et F. Kendall & Stuart Vol 1 donne des détails et des exemples.

whuber
la source
7

Cela ressemble à une approche «d'appariement des moments» pour ajuster une distribution aux données. Il est généralement considéré comme une mauvaise idée (le titre du billet de blog de John Cook est «une impasse statistique»).

shabbychef
la source
1

Le test K2 de D'Agostino vous dira si une distribution d'échantillon provient d'une distribution normale basée sur l'asymétrie et le kurtosis de l'échantillon.

Si vous voulez faire un test en supposant une distribution non normale (peut-être avec une asymétrie élevée ou une kurtosis), vous devrez déterminer quelle est la distribution. Vous pouvez regarder la distribution normale asymétrique et la distribution normale généralisée . Si vous faites cela, vous envisagez également d'autres distributions.

Thomas Levine
la source