Étant donné une séquence de variables aléatoires iid, disons, pour , j'essaie de limiter le nombre attendu de fois la moyenne empirique dépassera une valeur, , alors que nous continuons à tirer des échantillons, à savoir: i = 1 , 2 , . .1c≥0T d e f = n ∑ j=1P
Si nous supposons que pour certains , nous pouvons utiliser l'inégalité de Hoeffding pour arriver à
Ce qui semble agréable (peut-être) mais est en fait une limite assez lâche, existe-t-il de meilleures façons de limiter cette valeur? Je m'attends à ce qu'il y ait un moyen puisque les différents événements (pour chaque ) ne sont clairement pas indépendants, je ne connais aucun moyen d'exploiter cette dépendance. En outre, il serait bon de supprimer la restriction selon laquelle est supérieur à la moyenne.c
edit : La restriction sur étant supérieur à la moyenne peut être supprimée si nous utilisons l'inégalité de Markov comme suit:
Réponses:
Il s'agit d'une approche plutôt artisanale, et j'apprécierais vraiment certains commentaires à ce sujet (et les critiques sont généralement les plus utiles). Si je comprends bien, l'OP calcule la échantillon , où chaque échantillon contient l'observation précédente de l'échantillon +1 à partir d'un nouveau la distribution de chaque moyenne de l'échantillon. Ensuite, nous pouvons écrirex¯j Fj
Considérons une taille de l' échantillon après quoi la distribution de la moyenne échantillon est presque normal, noterons . Ensuite, nous pouvons écrirem G^
En résolvant nous obtenons où est la normale standard cdf, est l'écart-type du processus iid, et est sa moyenne. Insérer dans la limite et réorganiser nous obtenonsG^j(c)
Notez que cette limite dépend également de la variance du processus. Est-ce une meilleure limite que celle présentée dans la question? Cela dépendra essentiellement de la rapidité avec laquelle la distribution de la moyenne de l'échantillon deviendra «presque normale». Pour donner un exemple numérique, supposons que . Supposons également que les variables aléatoires soient uniformes dans . Ensuite, et . Considérons un écart de 10% par rapport à la moyenne, c'est-à-dire . alors: déjà pour la borne que je propose (qui est significative pour ) devient plus serrée. Pour la limite de Hoeffding est dem=30 [0,1] σ=112−−√ a=0,05n=34n>30n=10078,536,2≈199,5≈38,5aa=0,149,530,5n→∞μ=12 a=0.05 n=34 n>30 n=100 78.5 tandis que la limite que je propose est de . La limite de Hoeffding converge vers tandis que la limite que je propose à Si vous augmentez l'écart entre les deux limites diminue mais reste visible: pour un écart de 20%, , la limite de Hoeffding converge vers tandis que le borne que je propose converge à (c'est-à-dire que la somme des cdfs normaux contribue très peu à la borne globale).
Un peu plus généralement, nous notons que pour la borne de Hoeffding converge vers36.2 ≈199.5 ≈38.5 a a=0.1 49.5 30.5
n→∞
Ab→m
Étant donné que pour les petites valeurs de (ce qui est plutôt le cas d'intérêt) devient un grand nombre, il est toujours possible que surpasse en étanchéité, même si l'échantillon est tel que la distribution de la moyenne de l'échantillon converge lentement vers la distribution normale.H b A ba Hb Ab
la source