En tant qu'hypothèse de régression linéaire, la normalité de la distribution de l'erreur est parfois à tort "étendue" ou interprétée comme le besoin de normalité du y ou du x.
Est-il possible de construire un scénario / ensemble de données où les X et Y ne sont pas normaux mais où le terme d'erreur est et donc les estimations de régression linéaire obtenues sont valides?
Réponses:
Développer le commentaire de Hong Oois avec une image. Voici une image d'un ensemble de données où aucun des marginaux n'est normalement distribué mais les résidus le sont toujours, donc les hypothèses de régression linéaire sont toujours valides:
L'image a été générée par le code R suivant:
la source