J'ai des données sur une série de paris gagnants et perdants sur 5 tours d'enchères avec attrition après chaque tour. J'utilise un arbre de décision comme le suivant pour afficher les données.
Les nœuds vers le haut de l'arbre sont ceux qui ont des paris gagnants, et ceux vers le bas de l'arbre ont des séries de paris perdants. Je veux regarder (a) l'attrition à chaque nœud (b) les changements dans la taille moyenne des paris à chaque nœud. Je regarde le taux d'attrition à chaque nœud du nœud précédent et le taux de survie (en utilisant le nombre attendu de personnes à chaque nœud si la probabilité est de 50%). Par exemple, si la probabilité est de 50% à chaque nœud, sur les 1000 qui ont commencé, environ 500 personnes devraient se trouver dans chacun des seconds nœuds, W et L. L'hypothèse est (a) le taux d'attrition est plus élevé après la perte paris (b) la taille moyenne des paris est réduite après les perdants et augmentée après les gagnants.
Je veux juste le faire dans un cadre univarié très simple d'abord. Comment puis-je effectuer un test t pour montrer que le changement de taille moyenne de mise d'un nœud WW à un nœud WWW est statistiquement significatif si 50 personnes ont abandonné? Je ne suis pas sûr que ce soit la bonne approche: chaque pari suivant est indépendant, mais les gens abandonnent après les perdants, donc l'échantillon n'est pas égalé. Si c'était juste un cas où la même classe passait une série d'examens l'un après l'autre sans abandon, je comprendrais comment effectuer le test t approprié, mais je pense que c'est un peu différent.
Comment puis-je faire ceci? De plus, si les résultats sont faussés par un petit nombre de clients, comment pourrais-je éliminer les 5% supérieurs et les 5% inférieurs? Supprimez simplement les clients avec la taille de mise cumulée la plus élevée du pari 1 - 3?
J'ai les données à partir desquelles le chiffre a été généré, j'ai donc la moyenne, std, erreur std, etc. à chaque nœud.
la source
Réponses:
Il semble presque "évident en regardant" que les perdants étaient plus susceptibles d'abandonner que les gagnants.
Vous pouvez essayer un ensemble de tableaux de contingence pour déterminer si ce qui précède est statistiquement significatif. Par exemple, sur les 450 gagnants du premier pari, 25 ont abandonné et 425 sont restés et sur les 550 perdants, 150 ont abandonné et 400 sont restés. Etc.
la source
Cette réponse sera probablement un peu hors sujet, mais je vais commencer par ce qui est sur le sujet. Si on me demandait spécifiquement de déterminer si le changement de la taille moyenne des paris de WW à WWW était significatif, j'ignorerais les personnes qui n'ont pas atteint ces deux nœuds. Si le but de cette analyse est de pouvoir faire des prédictions pour le comportement futur, alors la mécanique de l'essai devrait bien émuler la mécanique du comportement futur, même si le jeu n'est pas un jeu de hasard. Quel est l'intérêt de mesurer comment le pari de quelqu'un changerait de WW à WWW s'il n'est pas le type de personne pour passer de WW à WWW.
Cela dit, en général, nous n'aimons évidemment pas exclure systématiquement certaines populations. Si on me donnait ces données, je me concentrerais sur les types d'analyses les plus réalisables. Plus particulièrement (surtout si ce n'est pas un jeu de hasard), les joueurs d'un nœud similaire ont beaucoup en commun. Ils ont eu la même séquence de (W, L) et n'en ont plus. Répondre aux questions du type «Quel est l'effet de la perte d'un tour de donner sur la taille et l'attrition des paris» est tout à fait réalisable tout en contrôlant le comportement dépendant du nœud, sous la forme d'un modèle à plusieurs niveaux.
Un dernier conseil serait de se concentrer sur les différences de niveau de joueur d'un tour à l'autre. La mise moyenne baissant de 5 cents après un peu peut être statistiquement insignifiante, alors que 90% des paris des joueurs baissant le seront probablement.
la source