Comment limiter la probabilité qu'une variable aléatoire soit maximale?

21

Supposons que nous ayons variables aléatoires indépendantes , , avec des moyens finis et des variances , \ ldots , \ sigma_N ^ 2 . Je recherche des bornes sans distribution sur la probabilité que tout X_i \ neq X_N soit plus grand que tous les autres X_j , j \ neq i .NX1Xnμ1μNσ12σN2XiXNXjji

En d'autres termes, si pour simplifier nous supposons que les distributions de Xi sont continues (telles que P(Xi=Xj)=0 ), je cherche des bornes sur:

P(Xi=maxjXj).
Si N=2 , nous pouvons utiliser l'inégalité de Chebyshev pour obtenir:
P(X1=maxjXj)=P(X1>X2)σ12+σ22σ12+σ22+(μ1μ2)2.
Je voudrais trouver des limites simples (pas nécessairement strictes) pour le N général N, mais je n'ai pas pu trouver de résultats (esthétiquement) agréables pour le N général N.

Veuillez noter que les variables ne sont pas supposées être iid. Toutes suggestions ou références à des travaux connexes sont les bienvenues.


Mise à jour: rappelez-vous que par hypothèse, μjμi . Nous pouvons alors utiliser la borne ci-dessus pour arriver à:

P(Xi=maxjXj)minj>iσi2+σj2σi2+σj2+(μjμi)2σi2+σN2σi2+σN2+(μNμi)2.
Cela implique:
(μNμi)P(Xi=maxjXj)(μNμi)σi2+σN2σi2+σN2+(μNμi)212σi2+σN2.
Cela implique à son tour:
i=1NμiP(Xi=maxjXj)μNN2i=1N1(σi2+σN2).
Je me demande maintenant si cette borne peut être améliorée à quelque chose qui ne dépend pas de façon linéaire sur N . Par exemple, la valeur suivante est-elle vérifiée:
i=1NμiP(Xi=maxjXj)μNi=1Nσi2?
Et sinon, quel pourrait être un contre-exemple?
MLS
la source
3
Cette borne peut être plus serré si vous utilisez l'index j qui vous donne la plus petite limite supérieure au lieu de N . Notez que cette valeur dépend à la fois de la moyenne et de la variance.
5
@ MichaelChernick: Je ne pense pas que ce soit correct. Supposons par exemple que nous ayons trois distributions uniformes sur [0,1] . Ensuite, si je ne me trompe pas, P(X1<maxjXj)=2/3 , tandis que P(X1<X2)=P(X1<X3)=1/2 . Je ne sais pas si vous vouliez écrire P(Xi>maxjXj) , mais alors le même exemple montre qu'il n'est toujours pas valide.
MLS
2
@Michael: Ce n'est toujours pas vrai, malheureusement. Les événements pour fixe ne sont pas indépendants. Aj={Xi>Xj} i
cardinal
2
@cardinal: Entre autres, c'est lié aux bandits multi-armés. Si vous choisissez un bras en fonction des récompenses précédentes, quelle est la probabilité que vous choisissiez le meilleur bras (ce serait dans la notation ci-dessus), et pouvons-nous limiter la perte attendue pour choisir un sous -bras optimal? P(XN=maxjXj)
MLS
2
Crossposted to MathOverflow: mathoverflow.net/questions/99313
cardinal

Réponses:

1

Vous pouvez utiliser l'inégalité multivariée de Chebyshev.

Cas de deux variables

Pour une seule situation, vs , j'arrive à la même situation que le commentaire de Jochen le 4 novembre 2016X1X2

1) Si alorsμ1<μ2P(X1>X2)(σ12+σ22)/(μ1μ2)2

(et je m'interroge également sur votre dérivation)

Dérivation de l'équation 1

  • en utilisant la nouvelle variableX1X2
  • le transformer de telle sorte qu'il a la moyenne à zéro
  • prendre la valeur absolue
  • appliquer l'inégalité de Chebyshev

P(X1>X2)=P(X1X2>0)=P(X1X2(μ1μ2)>(μ1μ2))P(|X1X2(μ1μ2)|>μ2μ1)σ(X1X2(μ1μ2))2(μ2μ1)2=σX12+σX22(μ2μ1)2

Cas multivarié

L'inégalité dans l'équation (1) peut être transformée en un cas multivarié en l'appliquant à plusieurs variables transformées pour chaque (notez qu'elles sont corrélées).(XnXi)i<n

Une solution à ce problème (multivariée et corrélée) a été décrite par I. Olkin et JW Pratt. «A Multivariate Tchebycheff Inequality» dans Annals of Mathematical Statistics, volume 29 pages 226-234 http://projecteuclid.org/euclid.aoms/1177706720

Remarque le théorème 2.3

P(|yi|kiσi for some i)=P(|xi|1 for some i)(u+(ptu)(p1))2p2

dans laquelle le nombre de variables, , et .pt=ki2u=ρij/(kikj)

Le théorème 3.6 fournit une limite plus stricte, mais est moins facile à calculer.

modifier

Une borne plus nette peut être trouvée en utilisant l' inégalité multivariée de Cantelli . Cette inégalité est le type que vous avez utilisé auparavant et qui vous a fourni la limite qui est plus nette que .(σ12+σ22)/(σ12+σ22+(μ1μ2)2)(σ12+σ22)/(μ1μ2)2

Je n'ai pas pris le temps d'étudier l'article en entier, mais de toute façon, vous pouvez trouver une solution ici:

AW Marshall et I. Olkin «Une inégalité unilatérale du type Chebyshev» dans Annals of Mathematical Statistics volume 31 pp. 488-491 https://projecteuclid.org/euclid.aoms/1177705913

(note ultérieure: cette inégalité est pour des corrélations égales et pas une aide suffisante. Mais de toute façon votre problème, pour trouver la borne la plus nette, est égal à l'inégalité Cantelli multivariée plus générale. Je serais surpris si la solution n'existe pas)

Sextus Empiricus
la source
Pourriez-vous fournir une déclaration claire de l'inégalité multivariée de Chebyshev?
whuber
1
J'ai édité la solution fournissant le théorème entier.
Sextus Empiricus
-1

J'ai trouvé un théorème qui pourrait vous aider et j'essaierai de l'adapter à vos besoins. Supposons que vous ayez:

exp(tE(max1inXi))

Ensuite par l'inégalité de Jensen (puisque exp (.) Est une fonction convexe), on obtient:

exp(tE(max1inXi))E(exp(tmax1inXi))=E(max1in exp(tXi))i=1nE(exp(tXi)

Maintenant, pour vous devez brancher quelle que soit la fonction de génération de moment de votre variable aléatoire (car ce n'est que la définition du mgf). Ensuite, après l'avoir fait (et potentiellement simplifiant votre terme), vous prenez ce terme et prenez le journal et le divisez par t pour obtenir une déclaration sur le terme . Ensuite, vous pouvez choisir t avec une valeur arbitraire (mieux pour que le terme soit petit pour que la borne soit serrée).exp(tXiXiE(max1inXi)

Ensuite, vous avez une déclaration sur la valeur attendue du maximum sur n rvs. Pour obtenir maintenant une déclaration sur la probabilité que le maximum de ces VR s'écarte de cette valeur attendue, vous pouvez simplement utiliser l'inégalité de Markov (en supposant que votre RV n'est pas négative) ou une autre RV, plus spécifique, s'appliquant à votre RV particulier.

Fabian Falck
la source