J'ai deux échantillons ( dans les deux cas). Les moyennes diffèrent d'environ deux fois la std groupée. dev. La valeur résultante est d'environ 10. Bien qu'il soit bon de savoir que j'ai démontré de façon concluante que les moyennes ne sont pas les mêmes, cela me semble être dicté par le grand n. En regardant les histogrammes des données, je ne pense certainement pas qu'une telle valeur p soit vraiment représentative des données et pour être honnête, je ne me sens pas vraiment à l'aise de la citer. Je pose probablement la mauvaise question. Ce que je pense, c'est: ok, les moyens sont différents, mais est-ce vraiment important car les distributions partagent un chevauchement important?T
Est-ce là que les tests bayésiens sont utiles? Si oui, où est un bon point de départ, un peu de recherche sur Google n'a rien donné d'utile, mais je ne peux pas en posant la bonne question. Si c'est la mauvaise chose, quelqu'un a-t-il des suggestions? Ou s'agit-il simplement d'un point de discussion par opposition à une analyse quantitative?
la source
Réponses:
Soit la moyenne de la première population et μ 2 la moyenne de la deuxième population. Il semble que vous ayez utilisé un test t à deux échantillons pour tester si μ 1 = μ 2 . Le résultat significatif implique que μ 1 ≠ μ 2 , mais la différence semble être trop petite pour avoir de l'importance pour votre application.μ1 μ2 t μ1= μ2 μ1≠ μ2
Ce que vous avez rencontré est le fait que statistiquement significatif peut souvent être autre chose que significatif pour l'application . Bien que la différence puisse être statistiquement significative, elle peut ne pas être significative .
Les tests bayésiens ne résoudront pas ce problème - vous conclurez toujours qu'il existe une différence.
Il pourrait cependant y avoir une issue. Par exemple, pour une hypothèse unilatérale, vous pourriez décider que si est Δ unités supérieur à μ 2, alors ce serait une différence significative suffisamment importante pour votre application.μ1 Δ μ2
Dans ce cas, vous testeriez si au lieu de si μ 1 - μ 2 = 0 . La statistique t (en supposant des variances égales) serait alors T = ˉ x 1 - ˉ x 2 - Δμ1- μ2≤ Δ μ1- μ2= 0 t
oùspest l'estimation de l'écart-type groupé. Dans l'hypothèse nulle, cette statistique estdistribuée entavecn1+n2-2degrés de liberté.
Un moyen facile de réaliser ce test consiste à soustraire de vos observations de la première population, puis à effectuer un test t à deux échantillons sur une seule face .Δ t
la source
Il est valable de comparer plusieurs approches, mais pas dans le but de choisir celle qui favorise nos désirs / croyances.
Ma réponse à votre question est: il est possible que deux distributions se chevauchent alors qu'elles ont des moyens différents, ce qui semble être votre cas (mais nous aurions besoin de voir vos données et votre contexte afin de fournir une réponse plus précise).
Je vais illustrer cela en utilisant quelques approches pour comparer les moyennes normales .
Pour une définition de la vraisemblance du profil et de la vraisemblance, voir 1 et 2 .
Pour les données simulées, celles-ci peuvent être calculées dans R comme suit
Encore une fois, les intervalles de crédibilité des moyens ne se chevauchent à aucun niveau raisonnable.
En conclusion, vous pouvez voir comment toutes ces approches indiquent une différence de moyenne significative (qui est le principal intérêt), malgré le chevauchement des distributions.
J'espère que ça aide.
la source
Répondre à la bonne question
Tout test qui demande si les moyennes de groupe sont différentes vous dira, si cela fonctionne bien, si les moyennes sont différentes. Il ne vous dira pas que les distributions des données elles-mêmes sont différentes, car c'est une question différente. Cette question dépend certainement de la question de savoir si les moyens sont différents, mais aussi de bien d'autres choses qui pourraient être (incomplètement) résumées comme variance, asymétrie et kurtosis.
Vous notez à juste titre que la certitude de l'emplacement des moyens dépend de la quantité de données dont vous disposez pour les estimer. Mais vous vous demandez si
En effet, ce n'est pas le cas, du moins pas directement. Et c'est par conception. Il est représentatif (approximativement parlant) de la certitude que vous pouvez avoir qu'une paire particulière de statistiques d'échantillonnage des données (et non les données elles-mêmes) sont différentes.
Si vous vouliez représenter les données elles-mêmes d'une manière plus formelle qu'en affichant simplement les histogrammes et en tester les moments, alors peut-être qu'une paire de graphiques de densité pourrait être utile. Cela dépend plutôt de l'argument que vous utilisez pour faire le test.
Une version bayésienne
À tous ces égards, les «tests» de différence bayésienne et les tests T se comporteront de la même manière car ils essaient de faire la même chose. Les seuls avantages auxquels je peux penser pour utiliser une approche bayésienne sont: a) qu'il sera facile de faire le test permettant des variances éventuellement différentes pour chaque groupe, et b) qu'il se concentrera sur l'estimation de la taille probable de la différence de moyennes plutôt que de trouver une valeur de p pour un test de différence. Cela dit, ces avantages sont assez mineurs: par exemple, en b), vous pouvez toujours signaler un intervalle de confiance pour la différence.
Les guillemets ci-dessus sur «tests» sont délibérés. Il est certainement possible de faire des tests d'hypothèse bayésienne, et les gens le font. Cependant, je dirais que l'avantage comparatif de l'approche réside dans la mise au point d'un modèle plausible des données et la communication de ses aspects importants avec des niveaux d'incertitude appropriés.
la source
Tout d'abord, ce n'est pas un problème pour épingler les tests fréquentistes. Le problème réside dans l'hypothèse nulle que les moyennes sont exactement égales. Par conséquent, si les populations diffèrent en termes de petite quantité et que la taille de l'échantillon est suffisamment grande, les chances de rejeter cette hypothèse nulle sont très élevées. Par conséquent, la valeur de p pour votre test s'est avérée très petite. Le coupable est le choix de l'hypothèse nulle. Choisissez d> 0 et supposez que l'hypothèse nulle est que les moyennes diffèrent de moins de d en valeur absolue de moins de d. Vous choisissez d pour que la différence réelle soit suffisamment grande pour être rejetée. Votre problème disparaît. Le test bayésien ne résout pas votre problème si vous insistez sur une hypothèse nulle d'égalité exacte des moyens.
la source