Quel serait un nombre minimal «raisonnable» d'observations pour rechercher une tendance dans le temps avec une régression linéaire? qu'en est-il de l'ajustement d'un modèle quadratique?
Je travaille avec des indices composites d'inégalité en santé (SII, RII), et n'ai que 4 vagues de l'enquête, donc 4 points (1997,2001,2004,2008).
Je ne suis pas statisticien, mais j'ai l'impression intuitive que 4 points ne suffisent pas. Avez-vous une réponse et / ou des références?
Merci beaucoup,
Françoise
regression
Françoise
la source
la source
Réponses:
La règle de base de Peters de 10 par covariable est une règle raisonnable. Une ligne droite peut parfaitement s'adapter à deux points quelconques quelle que soit la quantité de bruit dans les valeurs de réponse et une quadratique peut parfaitement s'adapter à seulement 3 points. Il est donc clair que dans presque toutes les circonstances, il serait approprié de dire que 4 points sont insuffisants. Cependant, comme la plupart des règles de base, il ne couvre pas toutes les situations. Les cas où le terme de bruit dans le modèle a une grande variance nécessiteront plus d'échantillons qu'un cas similaire où la variance d'erreur est faible.
Le nombre requis de points d'échantillonnage dépend des objets. Si vous effectuez une analyse exploratoire juste pour voir si un modèle (par exemple linéaire dans une covariable) semble meilleur qu'un autre (par exemple, une fonction quadratique de la covariable), moins de 10 points peut suffire. Mais si vous voulez des estimations très précises des coefficients de corrélation et de régression pour les covariables, vous pourriez avoir besoin de plus de 10 par covariable. Un critère d'exactitude de prédiction pourrait nécessiter encore plus d'échantillons que des estimations précises de paramètres. Il convient de noter que la variance des estimations et des prévisions implique toutes la variance du terme d'erreur des modèles.
la source