Rapport des résultats d'une régression linéaire simple: quelles informations inclure?

11

Je viens d'effectuer une régression linéaire (très) simple dans Genstat et j'aimerais inclure un résumé succinct et significatif de la sortie dans mon rapport. Je ne sais pas exactement quelle ou quelle quantité d'informations je devrais inclure.

Les bits principaux de ma sortie Genstat ressemblent à ceci:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

J'avais l'intention de signaler cela simplement comme:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

mais un collègue a suggéré que je devrais également inclure au moins le root mean squared error(qui, je crois dans ce cas, est égal à l'erreur type des observations, à savoir 99,9?).

L'inclusion du RMSE fournit-elle des informations utiles supplémentaires, ou la qualité de l'ajustement est-elle déjà suffisamment expliquée par la valeur R2 ajustée?

Existe-t-il des règles strictes pour déterminer la quantité d'informations à signaler, ou est-ce assez subjectif?

Merci beaucoup!

JamesS
la source
1
"Existe-t-il des règles strictes pour déterminer la quantité d'informations à signaler" - cela dépend vraiment de ce que vous voulez faire après la régression. On pourrait se contenter du coefficient de corrélation; on pourrait avoir besoin de la valeur Durbin-Watson en plus de cela, et encore un autre pourrait vouloir voir la diagonale de la matrice du chapeau ... cela dépend vraiment.
JM n'est pas statisticien
2
Certaines organisations ont des règles. Voir les directives de l' APA par exemple.
whuber

Réponses:

6

Pour une régression linéaire simple, je produirais toujours un tracé de la variable x par rapport à la variable y, avec la ligne de régression superposée au tracé (tracez toujours vos données chaque fois que c'est possible!). Cela vous indiquera très facilement dans quelle mesure votre modèle s'intègre et est facile à lire pour une régression variable. Ajouter cela à ce que vous avez déjà serait probablement suffisant, bien que vous souhaitiez peut-être inclure certaines parcelles de diagnostic (effet de levier, distance des cuisiniers, résidus, etc.). Cela dépend de la qualité de l'intrigue xy, de votre public cible et des protocoles que votre public attend.

R2

R2±±2R2

probabilitéislogique
la source
Merci @probabilityislogic. J'ai inclus un complot dans mon rapport, et il semble que plus ma phrase originale devrait être suffisante dans ce cas. Je pense que l'inclusion de tracés de diagnostic n'est probablement pas nécessaire pour ce public, bien que je les ai évidemment vérifiés moi-même et qu'ils semblent raisonnables. Merci aussi pour l'explication de R2 vs RMSE - c'est très utile.
JamesS
Qu'en est-il des valeurs t et df? Quand faut-il les inclure? Est-il seulement logique d'inclure les deux ou aucun?
fou sur natty
1

J'utilise pour déclarer le coefficient β plus l'IC à 95%, la valeur p et le Rsquared ajusté. Ex:

(β = 1,46, IC à 95% [1,19, 1,8], p = 0,001 **, R2 ajusté = 0,48)

Si je signale une régression multiple ou une régression avec des variables factorielles, je rapporte le coefficient, l'IC à 95%, les valeurs p, puis séparément les statistiques F (degrés de liberté), le R2 ajusté et la valeur p du modèle.

Bakaburg
la source