Toutes les boules dans l'urne sont-elles de la même couleur (quand elles ne peuvent pas être vues clairement)

8

J'ai un problème qui se réduit à des boules dans des urnes (il s'agit en fait d'allèles de référence et alternés dans les populations).

Supposons que j'ai une grande urne bien mélangée (tirages iid) qui peut contenir deux couleurs de boules: aigue-marine et bleu d'oeuf de Robin ( a et r respectivement). Ils sont de couleur proche, donc parfois une personne qui les classe fait une erreur en identifiant la couleur après avoir tiré une balle d'une urne. Soit la probabilité d'une erreur lorsque la balle est vraiment r et lorsque la balle est vraiment a . Supposons que je connaisse ces chiffres (je pense qu'ils sont inférieurs à 0,01 mais doivent encore être vérifiés) et j'ai choisi une signification.erea

Dans une expérience, mon compagnon tire boules de l'urne et identifie boules comme couleur r et comme a ( ). Il me dit ensuite et . Je veux tester que toutes les balles sont r contre l'urne contient au moins une balle étant donné le nombre de balles tirées.nran=r+araH0Ha

Mon objectif est de réaliser le test à 2 niveaux différents pour donner une note "étoile" à la force des résultats rapportés. Impossible de rejeter à 0,05 = 2 étoiles, rejeté à 0,05 = 3 étoiles et rejeté à 0,01 = 4 étoiles.

Quel test puis-je utiliser pour ce problème? (Bien que j'aie mis cela en termes conventionnels, je serais heureux d'obtenir un facteur Bayes et de définir des seuils en fonction de cela. Je suis également satisfait des tests qui nécessitent un certain nombre de mesures pour la validité - je peux simplement classer échantillons trop petits car "ne pouvaient pas rejeter")

Notez que cela est différent de tester une proportion car ces tests n'ont pas d'erreur de mesure (et ne fonctionnent pas pour une proportion = 0 ou 1). J'ai pensé essayer de définir une proportion non nulle en utilisant une sorte de facteur de fudge basé sur le taux d'erreur et la taille de l'échantillon (par exemple, tester où est la vraie proportion, mais je n'ai pas pu arriver avec un numéro bien justifié). J'ai également commencé à essayer de dériver mon propre test, mais cela prenait un certain temps et cela semble être le genre de problème que quelqu'un aurait étudié auparavant.H0H0=PerP

Modifier Réécrire légèrement la question pour préciser que je ne connais pas la séquence des tirages / classifications

Éponyme
la source

Réponses:

2

J'avoue que je n'ai pas entièrement lu l'autre réponse, mais une approche grossière serait simplement de noter que suit une distribution binomiale lorsque toutes les boules sont bleu oeuf de Robin, donc vous pouvez rejeter quand est "trop ​​grand" basé sur le modèle binomial. Si cela ne fonctionne pas, alors un test de rapport de vraisemblance serait peut-être mieux, ce qui semble être le but de Zachary Blumenfeld.a(n,p=er)a

dsaxton
la source
1

Je pense que j'ai la fonction de vraisemblance (divulgateur complet, je ne suis pas sûr à 100%). Une fois que vous avez dérivé une probabilité, le reste du test d'hypothèse devrait être plus facile.

Supposons que vous ayez dessiné un échantillon de taille noté . Pour simplifier, disons;n(X1,...Xn)

Xi={1ifclassifiedascolora0ifclassifiedascolorr
Indique en outre le "vrai" indicateur de couleur de l'observation comme tel que; Supposons également que le taux d'erreur est connu, . iXi
Xi={1ifobservationiscolora0ifobservationiscolorr
er(0,1)

La probabilité de conditionnelle à , est alors une distribution de Bernoulli; Nous pouvons également exprimer ceci comme; Nous connaissons également la probabilité de et que puis après une algèbre; XiXi

P(Xi=1|Xi,er)={1erifXi=1erifXi=0
P(Xi|Xi,er)=Xi[(1er)Xier1Xi]+(1Xi)[erXi(1er)1Xi]
Xi
P(Xi|p)=pXi(1p)1Xi
P(Xi|er,p)=P(Xi|Xi=1,er)P(Xi=1|p)+P(Xi|Xi=0,er)P(Xi=0|p)
P(Xi|er,p)=p[(1er)Xier1Xi]+(1p)[erXi(1er)1Xi]

Donc, votre probabilité est;

L(pX1,..,Xn,er)=i=1nP(Xi|er,p)
=i=1np[(1er)Xier1Xi]+(1p)[erXi(1er)1Xi]

Votre test d'hypothèse se réduit à vs . Vous pouvez le faire avec un facteur Bayes, ou avec une erreur standard dérivée de la vraisemblance, ou même via un bootstrap paramétrique. Comme vous le souhaitez. Maintenant que vous en avez la possibilité, le reste devrait être facile.H0:p=1H1:p0

Zachary Blumenfeld
la source
Je vois mais pas . Pour faire , je pense qu'il vous faut à la fois etP(Xi=1|Xi,er)P(Xi=0|Xi,ea)P(Xi|...)erea
Éponyme
Désolé, j'ai supposé dans ce problème, donc cela devra être changé. J'ai également écrit l'hypothèse dans le sens inverse (le zéro devrait être , mais cela peut également être facilement modifié.er=eap=0
Zachary Blumenfeld