Quelle est la distribution de la différence des distributions à deux t

19

... et pourquoi ?

En supposant que , sont des variables aléatoires indépendantes avec respectivement la moyenne et la variance . Mon livre de statistiques de base me dit que la distribution du a les propriétés suivantes:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1-X2

  • E(X1-X2)=μ1-μ2
  • Vuner(X1-X2)=σ12+σ22

maintenant que , sont des distributions t avec , degrés de liberté. Quelle est la distribution de ?X1X2n1-1n2-2X1-X2

Cette question a été éditée: La question d'origine était "Quels sont les degrés de liberté de la différence de deux distributions t?" . mpiktas a déjà souligné que cela n'a aucun sens puisque n'est pas distribué t, quelle que soit approximativement la normale (c'est-à-dire haute df).X1-X2X1,X2

steffen
la source
1
c'est une question connexe qui pourrait être intéressante.
mpiktas
2
Recherchez le test t de Satterthwaite, le test t CABF (approximation de Cochran au Behrens-Fisher) et le problème de Behrens-Fisher.
whuber
3
Pour le cas spécial où les degrés de liberté sont 1 (la distribution de Cauchy), la réponse à la question d'origine est 1. La somme (ou différence) de deux variables aléatoires distribuées de Cauchy indépendantes est Cauchy avec le paramètre d'échelle , mais là encore, le La distribution de Cauchy n'a même pas de valeur moyenne. 2
NRH
1
Vous devez vérifier la distribution Behrens – Fisher
Wis

Réponses:

15

La somme de deux variables aléatoires indépendantes distribuées en t n'est pas distribuée en t. Par conséquent, vous ne pouvez pas parler de degrés de liberté de cette distribution, car la distribution résultante n'a pas de degrés de liberté dans le sens de la distribution t.

mpiktas
la source
@mpiktas: Question stupide. Si la distribution t avec n-1 df peut être dérivée de la somme de n distributions normales indépendantes (voir wikipedia) et donnée df suffisamment élevée pour que la distribution t se rapproche de la distribution normale, ne dérive pas de cela que la somme des distributions t est encore une distribution t?
steffen
@mpiktas: Qu'en est-il de la statistique de test du test t, qui semble dériver de la différence de deux distributions t?
steffen
1
@steffen, non. Ce sera approximativement normal, puisque vous ajouterez deux variables normales réparties approximativement normales. la distribution t avec df élevé est approximativement normale, mais approximativement normale n'est pas nécessairement la distribution t avec df élevé.
mpiktas
1
@steffen, la statistique du test t est dérivée de la différence de deux normales et non de deux distributions t. Notez que la définition de la distribution t est une fraction de la racine normale et carrée du chi carré.
mpiktas
1
@steffen, je dis souvent à mes élèves qu'il n'y a pas de questions stupides, seulement des gens stupides qui ne posent aucune question. Je ne suis pas un professeur très populaire, je devrais ajouter :)
mpiktas
4

Convenez des réponses ci-dessus, la différence de deux variables aléatoires indépendantes distribuées en t n'est pas distribuée en t. Mais je veux ajouter quelques façons de calculer cela.

  1. La façon la plus simple de calculer cela est d'utiliser une méthode de Monte Carlo. Dans R, par exemple, vous échantillonnez au hasard 100 000 nombres de la première distribution t, puis vous échantillonnez au hasard 100 000 autres nombres de la deuxième distribution t. Vous laissez le premier ensemble de 100 000 numéros moins le deuxième ensemble de 100 000 numéros. Les 100 000 nouveaux nombres obtenus sont les échantillons aléatoires de la distribution de la différence entre les deux distributions. Vous pouvez calculer la moyenne et la variance en utilisant simplement mean()et var().

    1. C'est ce qu'on appelle la distribution de Behrens – Fisher. Vous pouvez vous référer à la page Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . Le CI donné par cette distribution est appelé "intervalle fiducial", ce n'est pas un CI .

    2. L'intégration numérique peut fonctionner. Ceci se poursuit sous forme de puce 2. Vous pouvez vous référer à la section 2.5.2 dans Inférence bayésienne dans l'analyse statistique par encadré, George EP, Tiao, George C. Elle contient les étapes détaillées de l'intégration, et comment cela est approximé une distribution de Behrens – Fisher.

Shijia Bian
la source
1
Il me semble que la distribution de Behrens-Fisher s'applique lorsque la variance des deux distributions t n'est pas égale. Peut-on en dire autant si la variance des deux distributions EST égale?
Ian Sudbery
1
Désolé, appuyez sur entrer deux tôt? Pour continuer ... Par exemple, disons que nous avons deux distributions normales de variance égale mais inconnue, mais de moyennes différentes. Nous tirons deux échantillons de chacune de ces distributions. La différence de moyenne entre les deux échantillons d'une même distribution suivra une distribution t, mais quelle est la distribution de la différence des différences.
Ian Sudbery