Un test de pièce équitable peut-il être appliqué à une pièce de monnaie qui atterrit souvent sur son bord?

8

Si vous lancez une pièce et obtenez 268 têtes et 98 queues, vous pouvez calculer la probabilité que la pièce soit équitable de plusieurs façons. Une simple observation heuristique aurait très probablement conclu qu'une telle pièce est injuste. J'ai calculé la valeur de p dans R avec:

> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19

Cette valeur est inférieure à 0,05, ergo nous rejetons l'hypothèse que c'est une pièce équitable.

Mais que se passe-t-il si vous avez dit que la même pièce a atterri sur son côté 676 fois pendant le procès. Heureusement, vous arriverez probablement à la même conclusion, mais les tests de pièces justes typiques seraient-ils toujours valables?

Voici un graphique pour illustrer le problème:

Quelles sont les méthodes valides pour tester l'hypothèse selon laquelle il existe une probabilité égale qu'un événement se produise dans les zones ombrées?

REMARQUE: il y a 629 mouvements positifs (413 négatifs) dans l'illustration du graphique.

Code R qui génère les données:

require("quantmod")

ticker <- getSymbols("SLV")[,6]

change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)  
change <- na.locf(change, na.rm=TRUE)   

# some other calculations

dens <- density(change)
plot(dens)

# some formatting stuff
Milktrader
la source
3
Il est clair que les données sur lesquelles ce graphique est basé ne sont pas dérivées du lancement d'une pièce et semblent être continues et non binaires. Pourriez-vous nous dire à quelle question de fond essayez-vous de répondre? Le mettre en termes d'un exemple stéréotypé n'aide pas ici.
2011
Le graphique est dérivé du calcul du montant (en pourcentage) de la clôture d'aujourd'hui par rapport à la clôture d'il y a 24 jours. Les modèles de tarification des options supposent qu'il existe une probabilité de 50% qu'un titre soit 10% plus élevé ou 10% plus bas en n jours. Ce graphique est une distribution des prix réels. Pouvons-nous accepter l'hypothèse selon laquelle il y a une probabilité égale que le prix d'une action soit 10% plus élevé ou 10% plus bas en n jours.
Milktrader
1
@Milktrader, tout d'abord, les modèles d'option ne supposent pas qu'il existe une probabilité égale de retour à la hausse de 10% par rapport à un retour à la baisse en pourcentage égal. En effet, les modèles d'options dans un cadre sans arbitrage ne fonctionnent même pas avec la distribution réelle des rendements. De plus, même la mesure neutre au risque suppose généralement que les prix ont une probabilité plus élevée de monter que de baisser. Enfin, votre commentaire fait deux déclarations très différentes sur les retours, même si vous semblez les considérer comme les mêmes. Vous pouvez peut-être reformuler et clarifier votre question.
cardinal
@cardinal Je m'intéresse en fait plus à la théorie des probabilités qu'aux modèles de tarification des options avec cette question, bien que le sujet des modèles de tarification des options soit intéressant. Vous avez probablement un modèle de tarification des options plus robuste, mais le mien montre qu'il y a un prob SLV de 14,81% qui ferme> 40,04 et un prob de 14,52% qu'il ferme <32,75 d'ici l'expiration de l'APR (20 jours). Je suis également heureux de reformuler ma question pour la clarifier, mais je ne sais pas comment j'ai fait deux déclarations uniques sur les retours.
Milktrader
@ Milktrader, j'essaie juste de comprendre quel problème vous essayez de résoudre. Ma référence aux modèles de tarification des options était en fait censée faire référence aux plus basiques et aux plus "standard". Actuellement, ils peuvent sembler supposer une distribution symétrique, mais ce ne serait que parce que les taux d'intérêt sont proches de zéro.
Cardinal

Réponses:

5

Je suis à peu près sûr que la réponse est oui , le test binomial standard de la `` monnaie équitable '' est toujours valide: si vous souhaitez tester si deux des trois probabilités d'une distribution multinomiale sont les mêmes mais que vous n'êtes intéressé par aucune hypothèse sur la troisième probabilité, vous pouvez analyser les nombres des deux résultats correspondants comme s'ils étaient tirés d'une distribution binomiale .

En fait, cela semble faire un assez bon exercice sur des statistiques suffisantes et une probabilité conditionnelle:

Vous pouvez considérer cela comme une distribution multinomiale avec trois résultats possibles et donc deux paramètres estimables (car les trois probabilités doivent être égales à 1). Mais vous n'êtes pas intéressé par la probabilité du résultat `` moyen '', vous pouvez donc considérer cela comme le paramètre de nuisance et la différence entre le nombre de résultats `` supérieurs '' et `` inférieurs '' comme paramètre d'intérêt.

Il est simple de montrer (en utilisant le théorème de factorisation de Fisher-Neyman ) que les nombres de résultats «supérieurs» et «inférieurs» forment ensemble une statistique suffisante (bidimensionnelle) pour le paramètre d'intérêt, c'est-à-dire le nombre de résultats «moyens» ne 't fournir des informations supplémentaires sur la valeur du paramètre d'intérêt. Le nombre de résultats «moyens» est clairement une statistique suffisante pour le paramètre de nuisance. Si nous conditionnons à ce dernier, je pense (je n'ai pas vérifié correctement) que la probabilité conditionnelle résultante finira par être la même que la probabilité de la distribution binomiale, c'est-à-dire le problème du lancer de pièces.

un arrêt
la source
1
C'est très simple car je n'ai fait aucun calcul. Tout ce que vous avez écrit sonne bien. La seule question qui me vient d'abord à l'esprit est qu'il semble que l'estimation de la variance pourrait être différente de si vous «jetiez» les échantillons correspondant au troisième résultat.
Cardinal
Oui, c'est la description officielle de mon problème. Une distribution multinomiale peut-elle être réduite à une distribution binomiale? Ce qui m'inquiète, c'est l'ampleur du résultat «intermédiaire».
Milktrader
J'accepte ceci comme "Oui, vous pouvez, à condition que votre probabilité conditionnelle soit la même que la probabilité de distribution binomiale". Je ne sais pas comment vous mettriez en place ce test, mais cela dépasse le cadre de ma question initiale.
Milktrader
Bien que l'explication de la réponse impliquait une vraisemblance conditionnelle, je voulais que ma réponse à votre question «les tests de pièces justes typiques seraient-ils toujours valides? être un non conditionnel oui !
2011 à
3

Si vous définissez cela comme un problème binomial (p, 1-p), et non comme un problème multinomial, vous ne pourrez décrire que le passé. Vous ne pourrez rien dire sur l'avenir. Pourquoi? Votre suppression des «flips de bord» du milieu est impliquée dans votre regroupement des données.

En d'autres termes, vos "données décrites" probabilité "p" d'un résultat positif et probabilité "1-p" d'un résultat négatif ne s'appliqueront pas au prochain "flip binomial de la pièce", car à l'avenir vous avez vraiment des probabilités "x", "y" et "(1-xy)".

Modifier (27/03/2011) ===============================

J'ai ajouté le diagramme suivant pour aider à expliquer mes commentaires ci-dessous.

entrez la description de l'image ici

bill_080
la source
Je ne peux donc pas prétendre que P (mouvement positif | mouvement de 10%)? Ou, si je sais qu'il y a un mouvement de 10%, je peux dire qu'un tel mouvement a une probabilité (268/366) d'être positif. Mais je pense que je peux toujours réclamer P (coup de 10% | coup positif), non? Si le mouvement est positif, il y a une probabilité (268/629) que le mouvement dépasse 10%. (Je n'ai pas imprimé le total des positifs sur le graphique parce que je ne pensais pas très loin).
Milktrader
@Milktrader: votre processus et vos chiffres d'origine sont basés sur une clôture quotidienne cohérente. Lorsque vous obtiendrez une clôture à l'avenir, elle sera également basée sur une clôture quotidienne. Ni l'un ni l'autre ne sont basés sur une «clôture préférée» (qui nécessite des informations CONNUES après coup). Vous pouvez représenter le processus comme un multinomial ou un binôme et demi (un processus binomial pour sélectionner le chemin "Préféré" par rapport à "Non préféré", puis un autre processus binomial utilisant vos "Probabilités préférées"). Essayez-le. Est-il possible de simuler le processus global avec les seules «probabilités préférées»?
bill_080
Si ce titre se déplace de 10% au cours des 24 prochains jours, puis-je affirmer que la probabilité que ce mouvement se déplace à la hausse est de 268/366? Je ne veux pas mélanger les délais. (vient de passer en revue la deuxième partie de votre commentaire)
Milktrader
@Milktrader: D'après les données ci-dessus, pour un delta de 24 jours, vous avez 268 Ups, 98 Downs et 676 Nulls (1042 Total Events). En supposant qu'aucun changement structurel, chaque jour de bourse du FUTUR, avant le jour de bourse, vous faites face aux probabilités de 268/1042 Ups, 98/1042 Downs. Les Nulls 676/1042 restants apparaîtront plus souvent. Tout cela concerne l'avenir. Après la clôture, vous saurez si c'est un «jour préféré», mais encore une fois c'est après la clôture (pas l'avenir). Vos «probabilités préférées» s'appliquent uniquement après coup (dans le passé). J'ai ajouté un diagramme dans ma réponse ci-dessus pour aider à expliquer.
bill_080