J'espère sincèrement avoir formulé cette question de manière à ce qu'elle puisse être résolue définitivement - sinon, faites-le moi savoir et je vais réessayer! Je devrais également, je suppose, noter que j'utiliserai R pour ces analyses.
J'ai plusieurs mesures plant performance (Ys)
dont je soupçonne qu'elles ont été influencées par quatre traitements que j'ai imposés - flower thinning (X1), fertilization (X2), leaf clipping (X3)
, et biased flower thinning (X4)
. Pour tous les Y possibles, N est au moins 242, donc mes tailles d'échantillon étaient grandes. Toutes les parcelles ont été éclaircies ou non, mais chaque parcelle a également été soumise à l'un (et un seul) des trois autres traitements (ou non - il y avait également des parcelles témoins). L'idée de cette conception était de tester si les trois autres traitements étaient capables de "masquer" ou "d'améliorer" les effets de l'amincissement. Ainsi, par conception, les trois derniers traitements (X2-X4) ne pouvaient pas interagir les uns avec les autres car ils n'étaient pas croisés, mais ils peuvent chacun interagir avec l'éclaircissement des fleurs - et ils le font probablement.
Mes hypothèses explicites sont que 1) l'éclaircie de la floraison sera significative et que 2) les termes d'interaction X1*X2, X1*X3, and X1*X4,
entre l'éclaircie des fleurs et les trois autres traitements seront également significatifs. C'est-à-dire que l'éclaircissage des fleurs devrait avoir de l'importance, mais les façons dont il importe devraient être considérablement modifiées par ce que les trois autres traitements ont fait.
Je voudrais inclure toutes ces informations dans un modèle mixte:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
Mais il y a un problème: j'ai de bonnes raisons de croire que les effets de l'amincissement sur Y ne sont pas linéaires. Ils sont probablement quadratiques mais peut-être même cubiques dans certains cas. En effet, les effets de l'amincissement sur les performances sont très susceptibles d'augmenter plus rapidement à des niveaux d'amincissement plus élevés. Si j'essaie de modéliser cette relation non linéaire via l'équation ci-dessus en ajoutant des termes quadratiques et cubiques pour X1, je ne sais pas comment modéliser les termes d'interaction - suis-je censé inclure toutes les combinaisons possibles de X1, (X1) ^ 2 et (X1) ^ 3 * X2, X3 et X4? Parce que cela semble être un grand nombre de paramètres à essayer d'estimer, même avec le nombre de points de données que j'ai, et je ne sais pas comment interpréter les résultats que j'obtiendrais. Cela dit, je n'ai aucune raison biologique de penser que ce serait une façon imprudente de modéliser la situation.
J'ai donc trois réflexions sur la façon de résoudre ce problème:
- Ajustez d'abord un modèle plus petit, par exemple
Y ~ X1 + X1^2 + X^3 + Random effects
, dans le seul but de déterminer si la relation entre l'amincissement et Y est linéaire, quadratique ou cubique, puis transformez l'amincissement via une racine carrée ou cubique pour linéariser la relation de manière appropriée. De là, les termes d'interaction peuvent être modélisés comme ci-dessus avec la variable transformée.- Supposons que les interactions significatives, si elles se produisent, n'affectent qu'un seul des termes X1 (c'est-à-dire uniquement le terme linéaire, quadratique ou cubique), et modélisez les interactions en conséquence. Je ne sais même pas si cette approche a du sens.
- Il suffit d'adapter le «modèle complet» avec tous les termes d'interaction possibles entre les termes d'amincissement et les autres traitements, comme discuté ci-dessus. Ensuite, élaguez les termes d'interaction insignifiants et utilisez des graphiques et d'autres techniques pour interpréter les résultats.
Laquelle de ces approches, le cas échéant, a le plus de sens et pourquoi, étant donné que je suis intéressé par les tests d'hypothèses et non par la sélection de modèles? En particulier, si # 1 ci - dessus n'a pas de sens, pourquoi? J'ai lu cet article et cet article et j'ai essayé de comprendre ce qu'ils pourraient signifier pour moi, mais toutes les sources pour une lecture plus approfondie seraient également très appréciées!
Je suis un fan de l'utilisation des régressions de lissage non paramétriques pour évaluer les formes fonctionnelles des relations entre les variables dépendantes et les prédicteurs, même lorsque je vais ensuite estimer des modèles de régression paramétrique. Bien que j'aie très souvent trouvé des relations non linéaires, je n'ai jamais trouvé de terme d'interaction d'interaction non linéaire, même lorsque les principaux effets sont fortement non linéaires. Mon retour à la maison: les effets d'interaction n'ont pas besoin d'être composés des mêmes formes fonctionnelles que les prédicteurs dont ils sont constitués.
la source