Cette question est dérivée de celle-ci à propos de la "règle .632". J'écris avec une référence particulière à la réponse / notation de user603 dans la mesure où cela simplifie les choses.
Cette réponse commence par un échantillon de taille avec remplacement, à partir de éléments distincts dans la collection (appelez-le) N. La probabilité que l' échantillon soit différent d'un élément particulier de N est alors
Dans cette réponse, tous les éléments de N ont une chance égale d'être tirés au hasard.
Ma question est la suivante: supposons plutôt que dans la question ci-dessus les éléments à dessiner soient tels qu'ils soient normalement distribués. Autrement dit, nous subdivisons la courbe normale standard de à en (disons) 100 sous-intervalles de longueur égale. Chacun des 100 éléments de N a une probabilité d'être dessinée qui est égale à la zone sous-tendue par la courbe dans son intervalle respectif.
Ma pensée était la suivante:
Le raisonnement est similaire à celui de la réponse liée, je pense. La probabilité que , avec un élément de N, soit dans laquelle est la probabilité de dessiner
La probabilité qu'un élément particulier m soit dans l'échantillon S de taille n est
= 1 - n ∏ 1 ( 1 - F i ) .
Un calcul semble montrer qu'à mesure que la longueur des sous-intervalles devient petite, la réponse converge vers le même nombre que dans le premier cas (probabilités de toutes égales).
Cela semble contre-intuitif (pour moi) car la construction semble inclure des éléments de N qui sont rares, donc je m'attendrais à un nombre inférieur à 0,632.
Aussi, si cela est correct, je suppose que nous aurions
que je ne sais pas encore être vrai ou faux.
Edit: Si c'est vrai, cela en généraliserait probablement.
Merci pour toutes informations.
la source
Réponses:
La question porte sur le comportement limitatif des
lorsque croît et que uniformément de telle sorte que (a) tous sont non négatifs et (b) ils se résument à l'unité. (Ceux-ci découlent de la construction du et des axiomes de probabilité.)n Fi Fi
Par définition, ce produit est l'exponentielle de son logarithme:
Le théorème de Taylor (avec la forme de Lagrange du reste) , appliqué à , établit quelog
pour certains dans l'intervalle . En d'autres termes, ces logarithmes sont égaux à jusqu'à des termes qui sont au plus fois . Mais lorsque est assez grand pour garantir que tous les sont plus petits que certains donnés (une condition assurée par le retrait uniforme des ), alors (b) implique et doncϕi [0,Fi] −Fi 1/2 F2i n Fi ϵ>0 Fi nϵ>∑Fi=1
par conséquent
serre le logarithme entre deux séquences convergeant vers . Puisque est continu, le produit converge vers l'exponentielle de cette limite, . par conséquent−1 exp ∏ni=1(1−Fi) exp(−1)
QED .
Un examen plus approfondi de cette analyse établit que l'erreur dans cette approximation (qui sera toujours une borne inférieure ) n'est pas plus grande que Par exemple, la division d'une distribution normale standard en tranches entre et produit un maximum près du mode , où il sera approximativement égal à l'aire d'un rectangle, . La limite précédente établit que la valeur de la formule sera à de sa valeur limite. L'erreur réelle est un ordre de grandeur moins,
R
(auquel nous pouvons faire confiance car aucun des n'est vraiment petit par rapport à ):En effet,0.6331615… 1−exp(−1) 0.6321206…
1 - prod(1-f)
est alors que est .la source