Je viens d'effectuer une régression linéaire (très) simple dans Genstat et j'aimerais inclure un résumé succinct et significatif de la sortie dans mon rapport. Je ne sais pas exactement quelle ou quelle quantité d'informations je devrais inclure.
Les bits principaux de ma sortie Genstat ressemblent à ceci:
Summary of analysis
Source d.f. s.s. m.s. v.r. F pr.
Regression 1 8128935. 8128935. 814.41 <.001
Residual 53 529015. 9981.
Total 54 8657950. 160332.
Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.
Estimates of parameters
Parameter estimate s.e. t(53) t pr.
Constant 41.5 30.7 1.35 0.182
UKHR_Ref 0.8659 0.0303 28.54 <.001
J'avais l'intention de signaler cela simplement comme:
Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).
mais un collègue a suggéré que je devrais également inclure au moins le root mean squared error
(qui, je crois dans ce cas, est égal à l'erreur type des observations, à savoir 99,9?).
L'inclusion du RMSE fournit-elle des informations utiles supplémentaires, ou la qualité de l'ajustement est-elle déjà suffisamment expliquée par la valeur R2 ajustée?
Existe-t-il des règles strictes pour déterminer la quantité d'informations à signaler, ou est-ce assez subjectif?
Merci beaucoup!
la source
Réponses:
Pour une régression linéaire simple, je produirais toujours un tracé de la variable x par rapport à la variable y, avec la ligne de régression superposée au tracé (tracez toujours vos données chaque fois que c'est possible!). Cela vous indiquera très facilement dans quelle mesure votre modèle s'intègre et est facile à lire pour une régression variable. Ajouter cela à ce que vous avez déjà serait probablement suffisant, bien que vous souhaitiez peut-être inclure certaines parcelles de diagnostic (effet de levier, distance des cuisiniers, résidus, etc.). Cela dépend de la qualité de l'intrigue xy, de votre public cible et des protocoles que votre public attend.
la source
J'utilise pour déclarer le coefficient β plus l'IC à 95%, la valeur p et le Rsquared ajusté. Ex:
Si je signale une régression multiple ou une régression avec des variables factorielles, je rapporte le coefficient, l'IC à 95%, les valeurs p, puis séparément les statistiques F (degrés de liberté), le R2 ajusté et la valeur p du modèle.
la source