Dans la modélisation statistique: les deux cultures, Leo Breiman écrit
La pratique appliquée actuelle consiste à vérifier l'ajustement du modèle de données à l'aide de tests d'adéquation et d'analyse résiduelle. À un moment donné, il y a quelques années, j'ai mis en place un problème de régression simulé en sept dimensions avec une quantité contrôlée de non-linéarité. Les tests standard de qualité d'ajustement n'ont rejeté la linéarité que lorsque la non-linéarité était extrême.
Breiman ne donne pas les détails de sa simulation. Il fait référence à un article qui, selon lui, donne une justification théorique de son observation, mais l'article n'est pas publié.
Quelqu'un a-t-il vu un résultat de simulation publié ou un document théorique pour appuyer la demande de Brieman?
la source
Réponses:
J'ai créé une simulation qui répondrait à la description de Breiman et n'ai trouvé que l'évidence: le résultat dépend du contexte et de ce que l'on entend par «extrême».
Beaucoup pourrait être dit, mais permettez-moi de le limiter à un seul exemple mené au moyen de
R
code facilement modifiable que les lecteurs intéressés pourront utiliser dans leurs propres investigations. Ce code commence par mettre en place une matrice de conception composée de valeurs indépendantes approximativement uniformément réparties qui sont approximativement orthogonales (afin que nous n'entrions pas dans des problèmes de multicolinéarité). Il calcule une seule interaction quadratique (c'est-à-dire non linéaire) entre les deux premières variables: ce n'est là qu'un des nombreux types de "non-linéarités" qui pourraient être étudiées, mais au moins c'est une commune, bien comprise. Ensuite, il standardise tout pour que les coefficients soient comparables:Pour le modèle OLS de base (sans non-linéarité), nous devons spécifier certains coefficients et l'écart-type de l'erreur résiduelle. Voici un ensemble de coefficients unitaires et un écart-type comparable:
Plutôt que de parcourir toutes les sorties ici, regardons ces données en utilisant la sortie de la
plot
commande:Les traces inférieures sur le triangle inférieur ne montrent essentiellement aucune relation linéaire entre l'interaction (
x.12
) et la variable dépendante (y
) et des relations linéaires modestes entre les autres variables ety
. Les résultats de l'OLS le confirment; l'interaction est à peine significative:Je prendrai la valeur de p du terme d'interaction comme test de non-linéarité: lorsque cette valeur de p est suffisamment faible (vous pouvez choisir à quel point elle est faible), nous aurons détecté la non-linéarité.
(Il y a ici une subtilité dans ce que nous recherchons exactement. En pratique, nous pourrions avoir besoin d'examiner toutes les interactions quadratiques possibles 7 * 6/2 = 21, ainsi que peut-être 7 termes quadratiques supplémentaires, plutôt que de nous concentrer sur un seul terme comme cela est fait ici. Nous voudrions faire une correction pour ces 28 tests interdépendants. Je ne fais pas explicitement cette correction ici, car à la place j'affiche la distribution simulée des valeurs de p. Vous pouvez lire les taux de détection directement à partir de les histogrammes à la fin en fonction de vos seuils de signification.)
Mais ne faisons pas cette analyse une seule fois; faisons-le beaucoup de fois, générant de nouvelles valeurs de
y
à chaque itération selon le même modèle et la même matrice de conception. Pour ce faire, nous utilisons une fonction pour effectuer une itération et renvoyer la valeur de p du terme d'interaction:J'ai choisi de présenter les résultats de la simulation sous forme d'histogrammes des valeurs de p, en faisant varier le coefficient normalisé
gamma
du terme d'interaction. Tout d'abord, les histogrammes:Maintenant, faisons le travail. Cela prend quelques secondes pour 1000 essais par simulation (et quatre simulations indépendantes, en commençant par la valeur donnée du terme d'interaction et en la divisant par deux à chaque fois)
Les resultats:
x
sd
beta
gamma
x
sd
beta
sd
En bref, une simulation comme celle-ci peut prouver tout ce que vous aimez si vous la configurez et l'interprétez correctement. Cela suggère que le statisticien individuel devrait mener ses propres explorations, adaptées aux problèmes particuliers auxquels il est confronté, afin de parvenir à une compréhension personnelle et approfondie des capacités et des faiblesses des procédures qu'il utilise.
la source
R
et apprécie toujours ces pointeurs.Je ne sais pas , il donne une réponse définitive à la question, mais je donne un coup d' oeil à ce . Surtout le point 2. Voir également la discussion à l'annexe A2 du document .
la source