Soit une classe de distributions de probabilités sur des réels non négatifs paramétrés par , de sorte que Je me demande quelles classes de distributions connues sont fermées en prenant le maximum et, ie si et sont indépendants alors .
distributions
Il y a
la source
la source
Réponses:
Il me semble que proposer des distributions de valeurs extrêmes répond vraiment à une question différente. Je démontrerai qu'en abordant cette question directement et en la montrant, elle conduit à des distributions qui ne font pas partie des types de valeurs extrêmes.
Examinons cela à partir des premiers principes. Il est immédiat, à partir des axiomes de probabilité et de définition du CDF, que la distribution du maximum de deux variables aléatoires indépendantes avec les CDF et a pour son CDF. Supposons qu'il existe une classe de distributions fermée sous le maximum par paire; C'est,F1 F2 F1F2 Ω={Fθ}
Il est pratique de prendre des logarithmes, en étendant (comme dans les textes d'analyse avancés de Rudin) les nombres réels pour inclure comme le log de . Les journaux de CDF de variables aléatoires essentiellement pris en charge sur sont (i) mononotiquement non croissants, (ii) égaux à sur , (iii) ont des limites droites de , et ( iv) sont cadlag. De ce point de vue, doit être un sous-ensemble convexe d'un cône dans l'espace des fonctions cadlag sur . Pour qu'il soit paramétré de manière finie, ce cône doit générer un sous-espace vectoriel de dimension finie. Cela laisse encore beaucoup de possibilités.−∞ 0 [0,∞) −∞ (−∞,0) 0 Ω R
Certaines de ces possibilités sont bien connues. Considérons, par exemple, le CDF d'une variable uniforme sur . Son CDF est égal à sur , lorsque et sur . Le cône qu'il génère est l'ensemble des CDF de la forme[0,1] 0 (−∞,0] x 0≤x≤1 1 [1,∞)
paramétré par . Il est clair que le maximum de deux variables aléatoires indépendantes avec des distributions dans cette famille a également une distribution dans cette famille (leurs paramètres s'ajoutent simplement). Nous pouvons, si nous le souhaitons, nous limiter à un sous-ensemble convexe de la forme et ont toujours une famille fermée au maximum. Notez, s'il vous plaît, qu'aucun membre de cette famille n'est une distribution de valeur extrême.θ>0 {Fθ|θ≥θ0}
Cette formulation inclut des distributions discrètes (qui ne font évidemment pas partie des trois types de distributions de valeurs extrêmes). Par exemple, considérons les distributions prises en charge sur les nombres naturels pour lesquels les probabilités sont données par0,1,2,…,k,…
(en prenant lorsque ), paramétré par . Par construction, le CDF , d'où il suitθ1/k=0 k=0 0<θ<1 Fθ(k)=θ1/(k+1)
et parce que les hypothèses impliquent , cela montre que la famille est fermée sous des maxima par paires.0<θϕ<1
J'espère que cette analyse et ces deux exemples montrent que, contrairement à une opinion exprimée dans un commentaire, l'approche de partir d'un nombre fini de CDF bien choisis et de les fermer par rapport au maximum par paire (c'est-à-dire former leurs cônes dans un espace vectoriel connexe approprié) est non seulement constructif mais donne des classes de distributions intéressantes et potentiellement utiles.
la source
Remarque: Cette réponse suppose que les variables sont distribuées de manière identique , et pas seulement réparties selon la même classe.
Ce seraient les distributions de valeurs extrêmes . Il y en a trois, comme ils sont généralement présentés, correspondant à trois ensembles de conditions sur la distribution sous-jacente pour lesquelles la distribution limite du maximum est trouvée. Ils sont fermés sous trouver le maximum, c'est ce que vous voulez.
Copie plus ou moins d'une ancienne version des méthodes d'analyse statistique des données de fiabilité et de vie (Mann, Schafer, Singpurwalla),
Tapez I:FX(n)(x)=exp{−exp[−x−γα]}, −∞<x<∞, α>0
Type II:FX(n)(x)=exp{−(x−γα)−β}, x≥γ, α,β>0
Type III:FX(n)(x)=exp{−[−(x−γα)β]}. x≤γ, α,β>0
Edit: Lisez les commentaires, qui étendent cette réponse pour apporter une réponse grandement améliorée et plus complète à cette question!
la source
jbowman m'a battu à la réponse. Une explication de la raison pour laquelle ils fonctionnent est que le théorème de Gnedenko déclare que si est une séquence de variables aléatoires indépendantes distribuées de manière identique sous certaines conditions à la fin de la distribution converge vers 1 des trois types que jbowman a énumérés dans sa réponse. Maintenant, comme toute distribution de type I, de type II ou de type III peut être exprimée comme la limite du max d'une séquence iid, alors si est de type I et est la distribution limite de car tend vers l'infini et est également de type I et est la limite deX1,…,Xn n Mn=max(X1,X2,…,Xn) G1 Mn=max(X1,X2,…,Xn) n G2 Nn=max(Y1,Y2,dotsc,Yn) alors dites et est la distribution de la limite lorsque approche de l'infini pour alors sera de type I et sera la distribution pour le maximum d'un rv avec la distribution et un autre avec la distribution et par conséquent, le type I est fermé sous maximisation. Le même argument fonctionne pour le type II et le type III.Vn=max(Mn,Nn) G3 n Vn G3 G1 G2
la source