Est-il possible que deux variables aléatoires d'une même famille de distribution aient la même attente et variance, mais des moments supérieurs différents?

12

Je pensais à la signification de la famille à l'échelle de l'emplacement. Je crois comprendre que pour chaque X membre d'un emplacement famille à grande échelle avec des paramètres emplacement et échelle, la distribution de ne dépend pas de tous les paramètres et il est le même pour tous appartenant à cette famille.b Z = ( X - a ) / b XabZ=(Xa)/bX

Donc, ma question est la suivante: pourriez-vous fournir un exemple où deux aléatoires de la même famille de distribution sont standardisés, mais cela ne donne pas une variable aléatoire avec la même distribution?

Supposons que et Y proviennent de la même famille de distribution (où avec famille, je veux dire par exemple à la fois Normal ou Gamma et ainsi de suite ..). Définir:XY

Z1=Xμσ

Z2=Yμσ

nous savons que Z1 et Z2 ont les mêmes attentes et variances, μZ=0,σZ2=1 .

Mais peuvent-ils avoir des moments supérieurs différents?

Ma tentative de répondre à cette question est que si la distribution de et Y dépend de plus de 2 paramètres, elle pourrait l'être. Et je pense au t - s t u d e n t généralisé qui a 3 paramètres.XYtstudent

Mais si le nombre de paramètres est et X et Y proviennent de la même famille de distribution avec la même attente et variance, cela signifie-t-il que Z 1 et Z 2 ont la même distribution (moments plus élevés)?2XYZ1Z2

gioxc88
la source
4
Oui, ils peuvent. Mais, vous auriez besoin d'au moins 3 paramètres dans une distribution généralisée.
Carl
5
@Carl Un paramètre suffira.
whuber
5
@Carl On ne sait pas ce que vous entendez par "même distribution". Littéralement, cela ferait référence à une distribution unique, avec une loi et donc une attente unique, une variance unique et des moments uniques (dans la mesure où ils sont définis). Si vous voulez dire «même famille de distribution », votre remarque n'a aucun sens, car la famille est ce que vous définissez comme étant.
whuber
3
@HardCore Puisqu'il semble que vous pensiez avoir répondu à votre question, veuillez consulter Que dois-je faire lorsque quelqu'un répond à ma question?
Glen_b -Reinstate Monica
2
@Carl, j'ai également voté positivement. L'utilisation de l'OP semble soutenir la notion de comme ayant la même distribution standard pour tous les choix de X dans la famille. Voyons quelle réponse l'OP accepte (si l'OP lit le commentaire de Glen_b et agit en conséquence). Z=(Xa)/bX
Dilip Sarwate,

Réponses:

7

Il y a apparemment une certaine confusion quant à ce qu'est une famille de distributions et comment compter les paramètres libres par rapport aux paramètres libres plus fixes (attribués). Ces questions sont un aparté qui n'est pas lié à l'intention du PO et à cette réponse. Je n'utilise pas le mot famille ici car c'est déroutant. Par exemple, une famille selon une source est le résultat de la variation du paramètre de forme. @whuber déclare qu'une "paramétrisation" d'une famille est une carte continue d'un sous-ensemble de ℝ n , avec sa topologie habituelle, dans l'espace des distributions, dont l'image est cette famille. n Je vais utiliser le mot forme qui couvre à la fois l'usage prévu du motidentification et comptage des familles et des paramètres . Par exemple, la formulex22x+4 a la forme d'une formule quadratique, c'est-à-direa2x2+a1x+a0 et sia1=0 la formule est toujours de forme quadratique. Cependant, quanda2=0la formule est linéaire et le formulaire n'est plus assez complet pour contenir un terme de forme quadratique. Ceux qui souhaitent utiliser le mot famille dans un contexte statistique approprié sont encouragés à contribuer à cette question distincte .

Répondons à la question "Peuvent-ils avoir des moments supérieurs différents?". Il existe de nombreux exemples. Nous notons au passage que la question semble concerner les PDF symétriques, qui sont ceux qui ont tendance à avoir un emplacement et une échelle dans le cas simple à deux paramètres. La logique: Supposons qu'il existe deux fonctions de densité avec des formes différentes ayant deux paramètres identiques (emplacement, échelle). Ensuite, il y a soit un paramètre de forme qui ajuste la forme, soit les fonctions de densité n'ont pas de paramètre de forme commun et sont donc des fonctions de densité sans forme commune.

Voici un exemple de la façon dont le paramètre de forme y figure. La fonction de densité d'erreur généralisée et ici , est une réponse qui semble avoir un kurtosis librement sélectionnable.

entrez la description de l'image ici

Par Skbkekas - Travail personnel, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753

Le PDF (fonction de densité AKA "probabilité", notez que le mot "probabilité" est superflu) est

β2αΓ(1β)e(|xμ|α)β

La moyenne et l'emplacement sont μ , l'échelle est α et β est la forme. Notez qu'il est plus facile de présenter des PDF symétriques, car ces PDF ont souvent l'emplacement et l'échelle comme les deux cas de paramètres les plus simples tandis que les PDF asymétriques, comme le PDF gamma , ont tendance à avoir la forme et l'échelle comme paramètres de cas les plus simples. En continuant avec la fonction de densité d'erreur, la variance est α2Γ(3β)Γ(1β), l'asymétrie est0et le kurtosis estΓ(5β)Γ(1β)Γ(3β)23. Ainsi, si nous fixons la variance à 1, alors nous attribuons la valeur deαpartir deα2=Γ(1β)Γ(3β)en faisant varierβ>0, de sorte que le kurtosis est sélectionnable dans la plage de0.601114à.

Autrement dit, si nous voulons faire varier les moments d'ordre supérieur, et si nous voulons maintenir une moyenne de zéro et une variance de 1, nous devons faire varier la forme. Cela implique trois paramètres, qui sont en général 1) la moyenne ou autrement la mesure appropriée de l'emplacement, 2) l'échelle pour ajuster la variance ou une autre mesure de la variabilité, et 3) la forme. IL FAUT AU MOINS TROIS PARAMÈTRES POUR LE FAIRE.

Notez que si nous faisons les substitutions β=2 , α=2σdans le PDF ci-dessus, on obtient

e(xμ)22σ22πσ,

qui est une fonction de densité d'une distribution normale. Ainsi, la fonction de densité d'erreur généralisée est une généralisation de la fonction de densité de la distribution normale. Il existe de nombreuses façons de généraliser la fonction de densité d'une distribution normale. Un autre exemple, mais avec la fonction de densité de la distribution normale uniquement comme valeur limite, et non avec des valeurs de substitution de milieu de gamme comme la fonction de densité d'erreur généralisée, est la fonction de densité de Student -t . En utilisant la fonction de densité de Student -t , nous aurions une sélection un peu plus restreinte de kurtosis, et df2 est le paramètre de forme car le deuxième moment n'existe pas pour df<2. De plus, df n'est pas réellement limité à des valeurs entières positives, il est en général réel 1 . L'élève -t ne devient normal dans la limite que df , c'est pourquoi je ne l'ai pas choisi comme exemple. Ce n'est ni un bon exemple ni un contre-exemple, et en cela je ne suis pas d'accord avec @ Xi'an et @whuber.

Permettez-moi d'expliquer cela plus en détail. On peut choisir deux des nombreuses fonctions de densité arbitraire de deux paramètres pour avoir, par exemple, une moyenne de zéro et une variance de un. Cependant, ils ne seront pas tous de la même forme. Cependant, la question concerne les fonctions de densité de la même forme, et non des formes différentes. L'affirmation a été faite que les fonctions de densité qui ont la même forme sont une attribution arbitraire car il s'agit d'une question de définition et en ce que mon avis diffère. Je ne suis pas d'accord pour dire que c'est arbitraire car on peut soit faire une substitution pour convertir une fonction de densité en une autre, soit on ne peut pas. Dans le premier cas, les fonctions de densité sont similaires, et si par substitution nous pouvons montrer que les fonctions de densité ne sont pas équivalentes, alors ces fonctions de densité sont de forme différente.

Ainsi, en utilisant l'exemple du PDF de Student -t , les choix sont de le considérer comme une généralisation d'un PDF normal, auquel cas un PDF normal a une forme autorisée pour le PDF de Student -t , ou non, dans ce cas, le PDF de Student -t est d'une forme différente du PDF normal et n'est donc pas pertinent pour la question posée .

Nous pouvons argumenter de cette manière. Mon opinion est qu'un PDF normale est un sous-sélectionné sous forme de l' étudiant -t de PDF, mais qu'un PDF normal n'est pas une sous-sélection d'un PDF gamma , même si une valeur limite d'un PDF gamma peut être démontré être un PDF normal, et ma raison en est que dans le cas normal / Student ' -t , le support est le même, mais dans le cas normal / gamma, le support est infini contre semi-infini, ce qui est l'incompatibilité requise .

Carl
la source
6
(-1) Comme cela a été dit dans d'autres commentaires, la question est "que signifie une famille de distribution?". Je peux facilement définir une nouvelle "famille" de distributions qui sont simplement des distributions t redimensionnées pour avoir une moyenne = 0, sd = 1, avec un seul paramètre: df. Ensuite, les 1er et 2e moments sont égaux pour tous les df, mais pour différentes valeurs de df, ils ont des moments supérieurs différents.
Cliff AB
5
Hard Core, ce commentaire est difficile à comprendre, étant donné que votre titre lui-même contient le mot "famille"! De plus, si vous niez qu'une famille a un sens, la question n'a aucun sens. Veuillez clarifier en modifiant votre question pour refléter vos intentions.
whuber
5
-1 parce que vous commencez par dire "La réponse est NON". puis passez à un exemple qui répond effectivement Oui (un autre exemple est donné dans la réponse de kjetilbhalvorsen que vous mentionnez favorablement). Cela n'a aucun sens pour moi. Je pense que les mathématiques ici sont claires pour nous tous, donc mon downvote est uniquement pour le manque de cohérence dans la présentation.
amibe dit Réintégrer Monica
3
Carl, il y a une incohérence flagrante entre la question et les commentaires de Hard Core. La question est explicite: «fournir un exemple où deux [variables] aléatoires de la même famille de distribution sont normalisées mais qui n'aboutissent pas à… des variables aléatoires avec la même distribution». De toute évidence, un sens de «famille» est recherché. Le sens habituel est clair, malgré l'existence de diverses variantes techniques, et la réponse correcte (facilement démontrée) est "oui, il existe de nombreux exemples".
whuber
4
Je vous remercie. De toute évidence, vous avez une bonne conception de ce que vous écrivez, mais malheureusement, votre message propage un peu de confusion quant à la signification de «distribution», «forme», «forme» et «paramètre». Comme exemple des subtilités, considérons une famille de distributions créées par n'importe quelle loi de distribution qui a un troisième moment central non nul. La famille est indexée par deux nombres réels ( μ , σ 0 ) et se compose de toutes les lois x F ( σ x + μ ) . Il s'agit d'une famille à l'échelle du lieu, mais les formes de ces lois diffèrent selon le signe de σ .F(μ,σ0)xF(σx+μ)σ
whuber
17

Si vous voulez un exemple qui est une "famille de distribution paramétrée officiellement nommée, vous pouvez regarder dans la distribution gamma généralisée, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Cette famille de distribution a trois paramètres, donc vous pouvez corriger la moyenne et la variance et ont toujours la liberté de varier les moments supérieurs. À partir de la page wiki, l'algèbre n'a pas l'air invitant, je préfère le faire numériquement. Pour les applications statistiques, recherchez ce site pour gamlss, qui est une extension de gam (additif généralisé modèles, en soi une généralisation des glm) qui ont des paramètres pour "emplacement, échelle et forme".

Un autre exemple est la distribution t , étendue à une famille à l'échelle de l'emplacement. Ensuite, le troisième paramètre sera les degrés de liberté, qui se méfieront de la forme pour un emplacement et une échelle fixes.

kjetil b halvorsen
la source
1
Bien que la distribution généralisée des erreurs ait pu être un meilleur choix.
Carl
2
Merci beaucoup pour votre réponse!! J'ai choisi celui de Carl parce qu'il était plus détaillé mais c'était bien aussi .. merci beaucoup !!!
gioxc88
14

Il y a un nombre infini de distributions avec un zéro moyen et une variance un, donc prenez distribué à partir de l'une de ces distributions, disons N ( 0 , 1 ) , et ϵ 2 à partir d'une autre de ces distributions, disons le t de Student avec 54 degrés de liberté redimensionnée par ϵ1N(0,1)ϵ2t pour que sa variance soit de un, alors X=μ+σϵ113 profitez des propriétés que vous mentionnez. Le "nombre" de paramètres n'est pas pertinent pour la propriété.

X=μ+σϵ1andY=μ+σϵ2

Évidemment, si vous définissez des règles supplémentaires pour la définition de cette famille, comme affirmant par exemple qu'il existe une densité fixe telle que la densité de X est 1fXvous pouvez vous retrouver avec une seule distribution possible.

1σdf({xμ}/σ)
Xi'an
la source
merci pour la réponse mais je pense que ce n'est pas ce que j'ai demandé
gioxc88
6
Je pense que c'est parce que si la famille de distributions est définie par la réunion à la fois des distributions des et des Y , alors vous avez une contradiction avec la propriété. Une «famille» de distributions est une notion assez vague. XY
Xi'an
oui en fait c'est assez vague mais si vous lisez ma question j'ai écrit que dans ce contexte avec la famille je veux dire par exemple à la fois Normal ou à la fois Gamma et ainsi de suite .. Vous avez fait un exemple avec un étudiant normal et un étudiant
gioxc88
4
Hard Core, vous semblez confondre le nom d'une famille avec son concept . Cette réponse est excellente et illustre bien le concept. Votre question ne demande pas que la solution soit une famille à l'échelle de l'emplacement. Si vous en avez besoin, vous pouvez toujours prendre cette réponse - ou toute autre réponse - et la prolonger à une famille à l'échelle de l'emplacement en autorisant des traductions et des mises à l'échelle arbitraires. Le point de Xi'an sur le nombre de paramètres est toujours valable.
whuber
@whuber Je pense que c'est une réponse confuse. L'élève-t en lui-même serait une meilleure réponse, plutôt que d'utiliser la réponse extrême de sans le spécifier. En effet, c'est d f qui est le troisième paramètre. df=3,df
Carl
6

Je pense que vous demandez si deux variables aléatoires provenant de la même famille d'échelles de localisation peuvent avoir la même moyenne et la même variance, mais au moins un moment supérieur différent. La réponse est non.

Preuve : Soit et X 2 deux de ces variables aléatoires. Comme X 1 et X 2 sont dans la même famille d'échelles de localisation, il existe une variable aléatoire X et des nombres réels a 1 > 0 , a 2 > 0 , b 1 , b 2 tels que X 1 d = a 1 X + b 1 et X 2 d = a 2 XX1X2X1X2Xa1>0,a2>0,b1,b2X1=da1X+b1 . Puisque X 1 et X 2 ont la même moyenne et la même variance, nous avons:X2=da2X+b2X1X2

  1. .E[X1]=E[X2]a1E[X]+b1=a2E[X]+b2
  2. .Var[X1]=Var[X2]a12Var[X]=a22Var[X]

Si , alors X 1 = E [ X 1 ] = X 2 = E [ X 2 ] avec probabilité 1 , et donc les moments supérieurs de X 1 et X 2 sont tous égaux. On peut donc supposer que Var [ X ] 0 . En utilisant ceci, (2) implique que | un 1 | = | un 2 | . DepuisVar[X]=0X1=E[X1]=X2=E[X2]1X1X2Var[X]0|a1|=|a2| et a 2 > 0 , on a en effet que a 1 = a 2 . À son tour, (1) ci-dessus implique maintenant que b 1 = b 2 . On a donc que: E [ X k 1 ] = E [ ( a 1 X + b 1 ) k ] = E [ ( a 2 X + b 2 ) k ] =a1>0a2>0a1=a2b1=b2 pour tout k , c'est-à-dire que tous les moments de X 1 et X 2 sont tous égaux.

E[X1k]=E[(une1X+b1)k]=E[(une2X+b2)k]=E[X2k],
kX1X2
yyzz
la source
1
(+1) Je ne trouve rien à redire à cette réponse. Apparemment, quelqu'un le fait, et il trouve également à redire au mien. Je ne comprends pas ce comportement inexpliqué.
Carl
5
@Carl Cette réponse est incorrecte - c'est pourquoi elle est sous-votée. Xi'an a déjà fourni un contre-exemple.
whuber
1
@whuber S'il vous plaît voir mes commentaires sous la réponse de Xi'an. Je ne suis pas d'accord avec lui mais je n'ai pas déçu parce que lui et vous avez droit à votre opinion, même si je la considère incorrecte.
Carl
8
@Carl Après avoir relu cette réponse, je dois retirer mon évaluation d'origine: cette réponse est correcte (et +1 pour cela), et elle est correcte car elle explique clairement comment elle interprète la question d'origine. (Plus précisément, il existe un concept commun mais étroit de «famille à l'échelle de l'emplacement», consistant en une seule distribution standard avec toutes ses traductions et ses échelons positifs.) Je pense que la question initiale visait à poser quelque chose d'un peu différent; la base de cette croyance est la référence à plus de deux paramètres dans le message.
whuber
2
Je suis désolé si je n'ai pas été très clair et je vous remercie pour le temps que vous avez passé à examiner cela, mais ce n'est pas ce que j'ai demandé.
gioxc88
1

Étant donné que la question peut être interprétée de plusieurs manières, je diviserai cette réponse en deux parties.

  • A: familles de distribution.
  • B: familles de distribution à l'échelle de l'emplacement.

Le problème du cas A peut être facilement résolu / démontré par de nombreuses familles avec un paramètre de forme.

RR>0

R: Deux distributions différentes de la même famille de distribution à 2 paramètres peuvent-elles avoir la même moyenne et la même variance?

La réponse est oui et elle peut déjà être montrée en utilisant l'un des exemples explicitement mentionnés: la distribution gamma normalisée

Famille de distributions gamma normalisées

Z=XμσXZ

FZ(z;k)={0ifz<k1Γ(k)γ(k,zk+k)ifzk

γ

Donc, ici, il est clair que différents Z1Z2μ=0σ=1k

B: Deux distributions différentes de la même famille de distribution à échelle de 2 paramètres peuvent-elles avoir la même moyenne et la même variance?

Je crois que la réponse est non si nous considérons uniquement les familles lisses (lisse: un petit changement dans les paramètres entraînera un petit changement de la distribution / fonction / courbe). Mais cette réponse n'est pas si banale et lorsque nous utiliserions des familles plus générales (non lisses), nous pouvons dire oui , bien que ces familles n'existent qu'en théorie et n'ont aucune pertinence pratique.

Génération d'une famille à l'échelle de l'emplacement à partir d'une distribution unique par traduction et mise à l'échelle

f(x)

f(x;μ,σ)=1σf(xμσ)

Pour une famille à l'échelle de l'emplacement qui peut être générée de cette manière, nous avons:

  • f(x;μ1,σ1)f(x;μ2,σ2)f(x;μ1,σ1)=f(x;μ2,σ2)

Pour les deux familles d'échelles de localisation de paramètres, leurs distributions de membres peuvent-elles être générées à partir d'une distribution de membre unique par traduction et mise à l'échelle?

θ1θ2μσ

Pour des familles d'échelles de localisation à deux paramètres comme la famille de distributions normales, il n'est pas trop difficile de montrer qu'elles peuvent être générées selon le processus ci-dessus (mise à l'échelle et traduction d'un seul membre d'exemple).

On peut se demander s’il est possible que chaque famille d’échelle d’emplacement à deux paramètres soit générée à partir d’un seul membre par traduction et mise à l’échelle. Ou une déclaration contradictoire: "Une famille à deux paramètres à l'échelle de l'emplacement peut-elle contenir deux distributions de membres différentes avec la même moyenne et la même variance?", Pour lesquelles il serait nécessaire que la famille soit une union de plusieurs sous-familles générées chacune par traduction et mise à l'échelle.

Cas 1: famille de distributions t de Student généralisées, paramétrée par deux variables

R2R3θ1θ2

Utilisons la distribution t de Student généralisée (à trois paramètres):

f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(xμσ)2)ν+12

μ=tan(θ1)σ=θ2ν=0.5+θ1/π

ensuite nous avons

f(x;θ1,θ2)=Γ(0.5+θ1/π+12)Γ(0.5+θ1/π2)π0.5+θ1/πθ2(1+10.5+θ1/π(xtan(θ1)θ2)2)0.5+θ1/π+12

qui peut être considérée comme une famille d'échelles de localisation à deux paramètres (bien que peu utile) qui ne peut pas être générée par la traduction et la mise à l'échelle d'un seul membre.

Cas 2: Familles à l'échelle de l'emplacement générées par une mise à l'échelle négative d'une distribution unique avec un biais non nul

xf(x/b+a)b

Familles lisses

f:R2R3fonctions continues qui feraient le travail comme les courbes de Peano).

θ1θ2θ1θ2μσ

θ1=fθ1(μ,σ)θ2=fθ2(μ,σ)

fθ1(μ,σ)μσ ne sont pas continues et ne pourront pas modéliser un paramètre de forme continue.

θ1θ1f(x;θ1)x

Sextus Empiricus
la source
1
XF,b1FθR2R3."Le problème avec ces" cartes "est qu'elles ne peuvent pas être continues et n'auront aucune signification statistique.
whuber
2
R2R3θθ
1
La deuxième puce est incorrecte: elle ne découle d'aucune des hypothèses ni ne fait partie de la définition d'une famille à l'échelle de l'emplacement.
whuber
1
θjeθjeXF(bX+une)F(une,b)R2b>0F
1
μσθ1θ2μσ