C'est ma première fois ici, alors faites-moi savoir si je peux clarifier ma question de quelque manière que ce soit (y compris le formatage, les balises, etc.). (Et j'espère pouvoir éditer plus tard!) J'ai essayé de trouver des références, et j'ai essayé de me résoudre en utilisant l'induction, mais j'ai échoué dans les deux cas.
J'essaie de simplifier une distribution qui semble se réduire à une statistique d'ordre d'un ensemble infiniment dénombrable de variables aléatoires indépendantes avec différents degrés de liberté; en particulier, quelle est la distribution de la e plus petite valeur parmi les ?
Je serais intéressé par le cas particulier : quelle est la distribution du minimum de (indépendant) ?
Pour le cas du minimum, j'ai pu écrire la fonction de distribution cumulative (CDF) comme un produit infini, mais je ne peux pas le simplifier davantage. J'ai utilisé le fait que le CDF de est
Un autre rappel potentiellement utile: est identique à une distribution exponentielle avec l'espérance 2, et est la somme de deux de ces exponentielles, etc.
Si quelqu'un est curieux, j'essaie de simplifier le théorème 1 dans cet article pour le cas de la régression sur une constante ( pour tout ). (J'ai au lieu des distributions car j'ai multiplié par .)
la source
Réponses:
Les zéros du produit infini seront l'union des zéros des termes. Le calcul jusqu'au 20e trimestre montre la tendance générale:
Ce tracé des zéros dans le plan complexe distingue les contributions des termes individuels dans le produit au moyen de symboles différents: à chaque étape, les courbes apparentes sont étendues davantage et une nouvelle courbe est lancée encore plus à gauche.
La complexité de cette image démontre qu'il n'existe pas de solution de forme fermée en termes de fonctions bien connues de l'analyse supérieure (telles que les gammas, les thétas, les fonctions hypergéométriques, etc., ainsi que les fonctions élémentaires, comme enquêté dans un texte classique comme Whittaker & Watson ).
Ainsi, le problème pourrait être posé de manière plus fructueuse un peu différemment : que devez-vous savoir sur les distributions des statistiques de commande? Des estimations de leurs fonctions caractéristiques? Des moments de faible ordre? Approximations aux quantiles? Autre chose?
la source
Toutes mes excuses pour votre arrivée avec 6 ans de retard. Même si le PO est probablement passé à d'autres problèmes, la question reste fraîche et j'ai pensé que je pourrais suggérer une approche différente.
On nous donne où où avec le pdf :X i ∼ Chisquared ( v i ) v i = 2 i f i ( x i )( X1, X2, X3, … ) Xje∼ Chisquared ( vje) vje= 2 i Fje( xje)
Voici un tracé du du pdf correspondant , à mesure que la taille de l'échantillon augmente, pour :Fje( xje) i = 1 à 8
Nous nous intéressons à la distribution de .min(X1,X2,X3,…)
Chaque fois que nous ajoutons un terme supplémentaire, le pdf du dernier terme marginal ajouté se déplace de plus en plus vers la droite, de sorte que l'effet de l'ajout de termes de plus en plus devient non seulement de moins en moins pertinent, mais après quelques termes seulement , devient presque négligeable - sur l'échantillon minimum. Cela signifie, en effet, que seul un très petit nombre de termes est susceptible d'avoir une importance réelle ... et l'ajout de termes supplémentaires (ou la présence d'un nombre infini de termes) est largement hors de propos pour le problème minimum de l'échantillon.
Tester
Pour tester cela, j'ai calculé le pdf de à 1 terme, 2 termes, 3 termes, 4 termes, 5 termes, 6 termes, 7 termes, 8 termes, à 9 termes et à 10 termes. Pour ce faire, j'ai utilisé la fonction de mathStatica , l'instruisant ici pour calculer le pdf de l'échantillon minimum (la statistique d'ordre ) dans un échantillon de taille , et où le paramètre (à la place d'être fixé) est :1 er j i v imin(X1,X2,X3,…) 1st j i vi
OrderStatNonIdentical
Cela devient un peu compliqué à mesure que le nombre de termes augmente ... mais j'ai montré la sortie pour 1 terme (1ère ligne), 2 termes (deuxième ligne), 3 termes (3ème ligne) et 4 termes ci-dessus.
Le diagramme suivant compare le pdf de l'échantillon minimum à 1 terme (bleu), 2 termes (orange), 3 termes et 10 termes (rouge). Notez la similitude des résultats avec seulement 3 termes contre 10 termes:
Le diagramme suivant compare 5 termes (bleu) et 10 termes (orange) - les graphiques sont tellement similaires qu'ils s'oblitèrent et on ne peut même pas voir la différence:
En d'autres termes, l'augmentation du nombre de termes de 5 à 10 n'a pratiquement aucun impact visuel perceptible sur la distribution de l'échantillon minimum.
Approximation semi-logistique
Enfin, une excellente approximation simple du pdf de l'échantillon min est la distribution semi-logistique avec pdf:
Le diagramme suivant compare la solution exacte à 10 termes (qui ne se distingue pas de 5 ou 20 termes) et l'approximation semi-logistique (en pointillés):
L'augmentation à 20 termes ne fait aucune différence perceptible.
la source