J'ai des données très corrélées. Si je lance une régression linéaire, j'obtiens une droite de régression avec une pente proche de une (= 0,93). Ce que je voudrais faire, c'est tester si cette pente est significativement différente de 1.0. Je m'attends à ce que ce ne soit pas le cas. En d'autres termes, je voudrais changer l'hypothèse nulle de la régression linéaire d'une pente de zéro à une pente d'un. Est-ce une approche sensée? J'apprécierais aussi vraiment que vous puissiez inclure du code R dans votre réponse afin que je puisse implémenter cette méthode (ou une meilleure que vous suggérez!). Merci.
regression
correlation
hypothesis-testing
Nick Crawford
la source
la source
Pour ces types d'hypothèses, vous pouvez utiliser la
linearHypothesis
fonction de package car :la source
Il semble que vous essayiez toujours de rejeter une hypothèse nulle. Il y a beaucoup de problèmes avec cela, le plus important étant qu'il est possible que vous n'ayez pas assez de puissance pour voir que vous êtes différent de 1. Il semble que vous ne vous souciez pas que la pente soit 0,07 différente de 1. Et si vous ne pouvez pas vraiment le dire? Que se passe-t-il si vous estimez en fait une pente qui varie énormément et peut en fait être assez loin de 1 avec quelque chose comme un intervalle de confiance de ± 0,4. Votre meilleure tactique ici n'est pas de changer l'hypothèse nulle mais de parler raisonnablement d'une estimation d'intervalle. Si vous appliquez la commande confint () à votre modèle, vous pouvez obtenir un intervalle de confiance de 95% autour de votre pente. Ensuite, vous pouvez l'utiliser pour discuter de la pente que vous avez obtenue. Si 1 se situe dans l'intervalle de confiance, vous pouvez indiquer qu'il se situe dans la plage de valeurs que vous pensez susceptibles de contenir la vraie valeur. Mais plus important encore, vous pouvez également indiquer quelle est cette plage de valeurs.
la source
Le point de test est que vous voulez rejeter votre hypothèse nulle, pas la confirmer. Le fait qu'il n'y ait pas de différence significative n'est nullement une preuve de l'absence de différence significative. Pour cela, vous devrez définir quelle taille d'effet vous jugez raisonnable pour rejeter la valeur nulle.
Vous devez maintenant être conscient du fait que la taille d'effet pour laquelle une différence devient significative, est
à condition d'avoir un estimateur décent de l'erreur type sur la pente. Par conséquent, si vous décidez qu'une différence significative ne doit être détectée qu'à partir de 0,1, vous pouvez calculer le DF nécessaire comme suit:
Attention, cela dépend assez de l'estimation de la séslope. Pour obtenir une meilleure estimation sur seslope, vous pouvez rééchantillonner vos données. Une manière naïve serait:
mettre seslope2 dans la fonction d'optimisation, renvoie:
Tout cela vous dira que votre jeu de données retournera un résultat significatif plus rapidement que vous le jugerez nécessaire, et que vous n'avez besoin que de 7 degrés de liberté (dans ce cas, 9 observations) si vous voulez être sûr que non significatif signifie ce que vous voulez veux dire.
la source