Je pensais à la signification de la famille à l'échelle de l'emplacement. Je crois comprendre que pour chaque membre d'un emplacement famille à grande échelle avec des paramètres emplacement et échelle, la distribution de ne dépend pas de tous les paramètres et il est le même pour tous appartenant à cette famille.b Z = ( X - a ) / b X
Donc, ma question est la suivante: pourriez-vous fournir un exemple où deux aléatoires de la même famille de distribution sont standardisés, mais cela ne donne pas une variable aléatoire avec la même distribution?
Supposons que et Y proviennent de la même famille de distribution (où avec famille, je veux dire par exemple à la fois Normal ou Gamma et ainsi de suite ..). Définir:
nous savons que et ont les mêmes attentes et variances, .
Mais peuvent-ils avoir des moments supérieurs différents?
Ma tentative de répondre à cette question est que si la distribution de et Y dépend de plus de 2 paramètres, elle pourrait l'être. Et je pense au t - s t u d e n t généralisé qui a 3 paramètres.
Mais si le nombre de paramètres est et X et Y proviennent de la même famille de distribution avec la même attente et variance, cela signifie-t-il que Z 1 et Z 2 ont la même distribution (moments plus élevés)?
Réponses:
Il y a apparemment une certaine confusion quant à ce qu'est une famille de distributions et comment compter les paramètres libres par rapport aux paramètres libres plus fixes (attribués). Ces questions sont un aparté qui n'est pas lié à l'intention du PO et à cette réponse. Je n'utilise pas le mot famille ici car c'est déroutant. Par exemple, une famille selon une source est le résultat de la variation du paramètre de forme. @whuber déclare qu'une "paramétrisation" d'une famille est une carte continue d'un sous-ensemble de ℝ n , avec sa topologie habituelle, dans l'espace des distributions, dont l'image est cette famille.n Je vais utiliser le mot forme qui couvre à la fois l'usage prévu du motidentification et comptage des familles et des paramètres . Par exemple, la formuleX2- 2 x + 4 a la forme d'une formule quadratique, c'est-à-direune2X2+ a1x + a0 et siune1= 0 la formule est toujours de forme quadratique. Cependant, quandune2= 0 la formule est linéaire et le formulaire n'est plus assez complet pour contenir un terme de forme quadratique. Ceux qui souhaitent utiliser le mot famille dans un contexte statistique approprié sont encouragés à contribuer à cette question distincte .
Répondons à la question "Peuvent-ils avoir des moments supérieurs différents?". Il existe de nombreux exemples. Nous notons au passage que la question semble concerner les PDF symétriques, qui sont ceux qui ont tendance à avoir un emplacement et une échelle dans le cas simple à deux paramètres. La logique: Supposons qu'il existe deux fonctions de densité avec des formes différentes ayant deux paramètres identiques (emplacement, échelle). Ensuite, il y a soit un paramètre de forme qui ajuste la forme, soit les fonctions de densité n'ont pas de paramètre de forme commun et sont donc des fonctions de densité sans forme commune.
Voici un exemple de la façon dont le paramètre de forme y figure. La fonction de densité d'erreur généralisée et ici , est une réponse qui semble avoir un kurtosis librement sélectionnable.
Par Skbkekas - Travail personnel, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
Le PDF (fonction de densité AKA "probabilité", notez que le mot "probabilité" est superflu) estβ2 α Γ ( 1β)e- ( | x - μ |α)β
La moyenne et l'emplacement sontμ , l'échelle est α et β est la forme. Notez qu'il est plus facile de présenter des PDF symétriques, car ces PDF ont souvent l'emplacement et l'échelle comme les deux cas de paramètres les plus simples tandis que les PDF asymétriques, comme le PDF gamma , ont tendance à avoir la forme et l'échelle comme paramètres de cas les plus simples. En continuant avec la fonction de densité d'erreur, la variance est α2Γ ( 3β)Γ ( 1β) , l'asymétrie est0 et le kurtosis estΓ(5β)Γ(1β)Γ(3β)2−3 . Ainsi, si nous fixons la variance à 1, alors nous attribuons la valeur deα partir deα2=Γ(1β)Γ(3β) en faisant varierβ>0 , de sorte que le kurtosis est sélectionnable dans la plage de−0.601114 à∞ .
Autrement dit, si nous voulons faire varier les moments d'ordre supérieur, et si nous voulons maintenir une moyenne de zéro et une variance de 1, nous devons faire varier la forme. Cela implique trois paramètres, qui sont en général 1) la moyenne ou autrement la mesure appropriée de l'emplacement, 2) l'échelle pour ajuster la variance ou une autre mesure de la variabilité, et 3) la forme. IL FAUT AU MOINS TROIS PARAMÈTRES POUR LE FAIRE.
Notez que si nous faisons les substitutionsβ=2 , α=2–√σ dans le PDF ci-dessus, on obtiente−(x−μ)22σ22π−−√σ,
qui est une fonction de densité d'une distribution normale. Ainsi, la fonction de densité d'erreur généralisée est une généralisation de la fonction de densité de la distribution normale. Il existe de nombreuses façons de généraliser la fonction de densité d'une distribution normale. Un autre exemple, mais avec la fonction de densité de la distribution normale uniquement comme valeur limite, et non avec des valeurs de substitution de milieu de gamme comme la fonction de densité d'erreur généralisée, est la fonction de densité de Student- t . En utilisant la fonction de densité de Student - t , nous aurions une sélection un peu plus restreinte de kurtosis, et df ≥2 est le paramètre de forme car le deuxième moment n'existe pas pour df <2 . De plus, df n'est pas réellement limité à des valeurs entières positives, il est en général réel ≥ 1 . L'élève - t ne devient normal dans la limite que df →∞ , c'est pourquoi je ne l'ai pas choisi comme exemple. Ce n'est ni un bon exemple ni un contre-exemple, et en cela je ne suis pas d'accord avec @ Xi'an et @whuber.
Permettez-moi d'expliquer cela plus en détail. On peut choisir deux des nombreuses fonctions de densité arbitraire de deux paramètres pour avoir, par exemple, une moyenne de zéro et une variance de un. Cependant, ils ne seront pas tous de la même forme. Cependant, la question concerne les fonctions de densité de la même forme, et non des formes différentes. L'affirmation a été faite que les fonctions de densité qui ont la même forme sont une attribution arbitraire car il s'agit d'une question de définition et en ce que mon avis diffère. Je ne suis pas d'accord pour dire que c'est arbitraire car on peut soit faire une substitution pour convertir une fonction de densité en une autre, soit on ne peut pas. Dans le premier cas, les fonctions de densité sont similaires, et si par substitution nous pouvons montrer que les fonctions de densité ne sont pas équivalentes, alors ces fonctions de densité sont de forme différente.
Ainsi, en utilisant l'exemple du PDF de Student- t , les choix sont de le considérer comme une généralisation d'un PDF normal, auquel cas un PDF normal a une forme autorisée pour le PDF de Student - t , ou non, dans ce cas, le PDF de Student - t est d'une forme différente du PDF normal et n'est donc pas pertinent pour la question posée .
Nous pouvons argumenter de cette manière. Mon opinion est qu'un PDF normale est un sous-sélectionné sous forme de l' étudiant- t de PDF, mais qu'un PDF normal n'est pas une sous-sélection d'un PDF gamma , même si une valeur limite d'un PDF gamma peut être démontré être un PDF normal, et ma raison en est que dans le cas normal / Student ' - t , le support est le même, mais dans le cas normal / gamma, le support est infini contre semi-infini, ce qui est l'incompatibilité requise .
la source
Si vous voulez un exemple qui est une "famille de distribution paramétrée officiellement nommée, vous pouvez regarder dans la distribution gamma généralisée, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Cette famille de distribution a trois paramètres, donc vous pouvez corriger la moyenne et la variance et ont toujours la liberté de varier les moments supérieurs. À partir de la page wiki, l'algèbre n'a pas l'air invitant, je préfère le faire numériquement. Pour les applications statistiques, recherchez ce site pour gamlss, qui est une extension de gam (additif généralisé modèles, en soi une généralisation des glm) qui ont des paramètres pour "emplacement, échelle et forme".
Un autre exemple est la distributiont , étendue à une famille à l'échelle de l'emplacement. Ensuite, le troisième paramètre sera les degrés de liberté, qui se méfieront de la forme pour un emplacement et une échelle fixes.
la source
Il y a un nombre infini de distributions avec un zéro moyen et une variance un, donc prenez distribué à partir de l'une de ces distributions, disons N ( 0 , 1 ) , et ϵ 2 à partir d'une autre de ces distributions, disons le t de Student avec 54 degrés de liberté redimensionnée par √ϵ1 N(0,1) ϵ2 t pour que sa variance soit de un, alors
X=μ+σϵ113−−√
profitez des propriétés que vous mentionnez. Le "nombre" de paramètres n'est pas pertinent pour la propriété.
Évidemment, si vous définissez des règles supplémentaires pour la définition de cette famille, comme affirmant par exemple qu'il existe une densité fixe telle que la densité de X est 1f X vous pouvez vous retrouver avec une seule distribution possible.
la source
Je pense que vous demandez si deux variables aléatoires provenant de la même famille d'échelles de localisation peuvent avoir la même moyenne et la même variance, mais au moins un moment supérieur différent. La réponse est non.
Preuve : Soit et X 2 deux de ces variables aléatoires. Comme X 1 et X 2 sont dans la même famille d'échelles de localisation, il existe une variable aléatoire X et des nombres réels a 1 > 0 , a 2 > 0 , b 1 , b 2 tels que X 1 d = a 1 X + b 1 et X 2 d = a 2 XX1 X2 X1 X2 X a1>0,a2>0,b1,b2 X1=da1X+b1 . Puisque X 1 et X 2 ont la même moyenne et la même variance, nous avons:X2=da2X+b2 X1 X2
Si , alors X 1 = E [ X 1 ] = X 2 = E [ X 2 ] avec probabilité 1 , et donc les moments supérieurs de X 1 et X 2 sont tous égaux. On peut donc supposer que Var [ X ] ≠ 0 . En utilisant ceci, (2) implique que | un 1 | = | un 2 | . DepuisVar[X]=0 X1=E[X1]=X2=E[X2] 1 X1 X2 Var[X]≠0 |a1|=|a2| et a 2 > 0 , on a en effet que a 1 = a 2 . À son tour, (1) ci-dessus implique maintenant que b 1 = b 2 . On a donc que:
E [ X k 1 ] = E [ ( a 1 X + b 1 ) k ] = E [ ( a 2 X + b 2 ) k ] =a1>0 a2>0 a1=a2 b1=b2
pour tout k , c'est-à-dire que tous les moments de X 1 et X 2 sont tous égaux.
la source
Étant donné que la question peut être interprétée de plusieurs manières, je diviserai cette réponse en deux parties.
Le problème du cas A peut être facilement résolu / démontré par de nombreuses familles avec un paramètre de forme.
R: Deux distributions différentes de la même famille de distribution à 2 paramètres peuvent-elles avoir la même moyenne et la même variance?
La réponse est oui et elle peut déjà être montrée en utilisant l'un des exemples explicitement mentionnés: la distribution gamma normalisée
Famille de distributions gamma normalisées
Donc, ici, il est clair que différentsZ1 Z2 μ=0 σ=1 k
B: Deux distributions différentes de la même famille de distribution à échelle de 2 paramètres peuvent-elles avoir la même moyenne et la même variance?
Je crois que la réponse est non si nous considérons uniquement les familles lisses (lisse: un petit changement dans les paramètres entraînera un petit changement de la distribution / fonction / courbe). Mais cette réponse n'est pas si banale et lorsque nous utiliserions des familles plus générales (non lisses), nous pouvons dire oui , bien que ces familles n'existent qu'en théorie et n'ont aucune pertinence pratique.
Génération d'une famille à l'échelle de l'emplacement à partir d'une distribution unique par traduction et mise à l'échelle
Pour une famille à l'échelle de l'emplacement qui peut être générée de cette manière, nous avons:
Pour les deux familles d'échelles de localisation de paramètres, leurs distributions de membres peuvent-elles être générées à partir d'une distribution de membre unique par traduction et mise à l'échelle?
Pour des familles d'échelles de localisation à deux paramètres comme la famille de distributions normales, il n'est pas trop difficile de montrer qu'elles peuvent être générées selon le processus ci-dessus (mise à l'échelle et traduction d'un seul membre d'exemple).
On peut se demander s’il est possible que chaque famille d’échelle d’emplacement à deux paramètres soit générée à partir d’un seul membre par traduction et mise à l’échelle. Ou une déclaration contradictoire: "Une famille à deux paramètres à l'échelle de l'emplacement peut-elle contenir deux distributions de membres différentes avec la même moyenne et la même variance?", Pour lesquelles il serait nécessaire que la famille soit une union de plusieurs sous-familles générées chacune par traduction et mise à l'échelle.
Cas 1: famille de distributions t de Student généralisées, paramétrée par deux variables
Utilisons la distribution t de Student généralisée (à trois paramètres):
ensuite nous avons
qui peut être considérée comme une famille d'échelles de localisation à deux paramètres (bien que peu utile) qui ne peut pas être générée par la traduction et la mise à l'échelle d'un seul membre.
Cas 2: Familles à l'échelle de l'emplacement générées par une mise à l'échelle négative d'une distribution unique avec un biais non nul
Familles lisses
la source