J'ai un problème qui se réduit à des boules dans des urnes (il s'agit en fait d'allèles de référence et alternés dans les populations).
Supposons que j'ai une grande urne bien mélangée (tirages iid) qui peut contenir deux couleurs de boules: aigue-marine et bleu d'oeuf de Robin ( a et r respectivement). Ils sont de couleur proche, donc parfois une personne qui les classe fait une erreur en identifiant la couleur après avoir tiré une balle d'une urne. Soit la probabilité d'une erreur lorsque la balle est vraiment r et lorsque la balle est vraiment a . Supposons que je connaisse ces chiffres (je pense qu'ils sont inférieurs à 0,01 mais doivent encore être vérifiés) et j'ai choisi une signification.
Dans une expérience, mon compagnon tire boules de l'urne et identifie boules comme couleur r et comme a ( ). Il me dit ensuite et . Je veux tester que toutes les balles sont r contre l'urne contient au moins une balle étant donné le nombre de balles tirées.
Mon objectif est de réaliser le test à 2 niveaux différents pour donner une note "étoile" à la force des résultats rapportés. Impossible de rejeter à 0,05 = 2 étoiles, rejeté à 0,05 = 3 étoiles et rejeté à 0,01 = 4 étoiles.
Quel test puis-je utiliser pour ce problème? (Bien que j'aie mis cela en termes conventionnels, je serais heureux d'obtenir un facteur Bayes et de définir des seuils en fonction de cela. Je suis également satisfait des tests qui nécessitent un certain nombre de mesures pour la validité - je peux simplement classer échantillons trop petits car "ne pouvaient pas rejeter")
Notez que cela est différent de tester une proportion car ces tests n'ont pas d'erreur de mesure (et ne fonctionnent pas pour une proportion = 0 ou 1). J'ai pensé essayer de définir une proportion non nulle en utilisant une sorte de facteur de fudge basé sur le taux d'erreur et la taille de l'échantillon (par exemple, tester où est la vraie proportion, mais je n'ai pas pu arriver avec un numéro bien justifié). J'ai également commencé à essayer de dériver mon propre test, mais cela prenait un certain temps et cela semble être le genre de problème que quelqu'un aurait étudié auparavant.
Modifier Réécrire légèrement la question pour préciser que je ne connais pas la séquence des tirages / classifications
la source