Puis-je estimer la fréquence d'un événement sur la base d'échantillonnages aléatoires de son occurrence?

9

Quelques modifications apportées ...

Cette question est juste pour le plaisir, donc si ce n'est pas amusant, n'hésitez pas à l'ignorer. Je reçois déjà beaucoup d'aide de ce site, donc je ne veux pas mordre la main qui me nourrit. C'est basé sur un exemple réel et c'est juste quelque chose que je me suis beaucoup demandé.

Je visite mon dojo local pour m'entraîner sur une base essentiellement aléatoire du lundi au vendredi. Supposons que je visite deux fois par semaine. Cela signifie que je visite exactement deux fois, chaque semaine, avec seulement deux jours variables. Il y a un individu qui est presque toujours là chaque fois que j'y suis. S'il visite le même jour que moi, je le verrai. Supposons qu'il soit là 90% du temps quand je suis là. Je veux savoir deux choses:

1) combien de fois il s'entraîne

2) s'il vient au hasard ou à des jours fixes de la semaine.

Je suppose que nous devons peut-être supposer l'un pour deviner l'autre? Je n'ai vraiment rien du tout avec ça. J'y pense juste à l'échauffement chaque semaine et je suis à nouveau perplexe. Même si quelqu'un me permettait de réfléchir au problème, je serais très reconnaissant.

À votre santé!

Chris Beeley
la source
1
@Chris, vous devez commencer par définir votre modèle. Lorsque vous dites que vous visitez deux fois par semaine au hasard, cela peut potentiellement signifier beaucoup de choses. Par exemple, vous pouvez aller chaque semaine exactement deux fois, choisi comme une combinaison aléatoire de deux éléments de l'ensemble , ou vous pouvez aller en moyenne deux fois par semaine où, disons, vous lancez une pièce biaisée avec une probabilité de 2/5 têtes et vous allez tous les jours vous voyez une tête. Ce ne sont pas les seules options. {Mon,,Fri}
Cardinal
Supposez-vous également que vous le verrez toujours si vous visitez le dojo le même jour que lui? Sinon, je pense que nous aurions besoin de savoir quelque chose sur la durée de vos sessions et la durée de ses sessions par rapport à la durée de chaque jour d'ouverture du dojo.
2011
1
@Chris, @onestop, cette question me rappelle et est liée à une technique utilisée pour échantillonner des personnes qui pourraient être réticentes à répondre à une question honnêtement, souvent en raison de la stigmatisation sociale de la réponse affirmative. Vous introduisez un élément aléatoire dans l'échantillonnage de telle sorte qu'avec une probabilité assez élevée, le répondant répond affirmativement (réponse plus embarrassante) même si en vérité il aurait répondu négativement. Si la probabilité d'un «oui» déterminé au hasard est suffisamment élevée, le «biais d'embarras» est réduit. Bien sûr, il faut aussi échantillonner plus de personnes.
Cardinal
1
@Chris Il faudrait faire encore plus d'hypothèses. Dans l'état actuel des choses, il existe une multitude d'explications valables. En voici une idiote: les visites individuelles sont-elles indépendantes des vôtres? Sinon, il ne visitera peut-être que lorsque vous visitez (il cherche votre voiture à l'extérieur tous les jours), mais lance une pièce (avec une probabilité de 0,9) avant de décider s'il y a lieu.
vqv
1
Solution simple: demandez-lui :-).
whuber

Réponses:

5

Vos données donneront des réponses partielles au moyen des estimateurs de Hansen-Hurwitz ou Horvitz-Thompson .

Le modèle est le suivant: représenter la fréquentation de cette personne comme une séquence de variables indicatrices (0/1) , . Vous observez au hasard un sous-ensemble à deux éléments de chaque bloc hebdomadaire . (Il s'agit d'une forme d'échantillonnage systématique.)i = 1 , 2 , ( q 5 k + 1 , q 5 k + 2 , , q 5 k + 5 )(qi)i=1,2,(q5k+1,q5k+2,,q5k+5)

  1. À quelle fréquence s'entraîne- t- il ? Vous voulez estimer la moyenne hebdomadaire du . Les statistiques que vous collectez vous indiquent que l'observation moyenne est de 0,9. Supposons que cela a été collecté sur semaines. L'estimateur de Horvitz-Thompson du nombre total de visites de l'individu est alors = = = (où est la chance d'observer et la somme est supérieure à vos observations réelles.) Autrement dit, vous devez estimer qu'il s'entraîne 4,5 jours par semaine. w q iqiw 5qiπi552qi4,5wπiqi52(2w)0.94.5wπiqi Voir la référence pour savoir comment calculer l'erreur-type de cette estimation. Comme très bonne approximation, vous pouvez utiliser les formules habituelles (binomiales).

  2. S'entraîne-t-il au hasard ? Il n'y a aucun moyen de le savoir. Vous devez maintenir les totaux par jour de la semaine.

whuber
la source