Cette question a été posée ici mais personne n'a donné une bonne réponse. Je pense donc que c'est une bonne idée de revenir sur ce sujet et je voudrais également ajouter quelques commentaires / questions.
La première question est quelle est la différence entre la "modélisation de chemin PLS" et la "régression PLS"? Pour le rendre plus général, que sont la modélisation par équation structurelle (SEM), la modélisation de chemin et la régression? À ma connaissance, la régression se concentre davantage sur la prédiction tandis que la SEM se concentre sur la relation entre la réponse et les prédicteurs et la modélisation du chemin est un cas spécial de SEM?
Ma deuxième question est de savoir à quel point le PLS est fiable? Récemment, il a fait l'objet de nombreuses critiques, comme souligné dans Rönkkö et al. 2016 et Rönkkö et al. 2015, ce qui conduit au rejet des articles basés sur PLS dans des revues de haut niveau telles que Journal of Operations Management ( voici la note du rédacteur en chef):
Nous rejetons pratiquement tous les manuscrits basés sur PLS, car nous avons conclu que PLS était sans exception la mauvaise approche de modélisation dans les types de modèles utilisés par les chercheurs de l'OM .
Je dois noter que mon domaine est la spectroscopie, ni la gestion / psychologie ni les statistiques. Dans les articles liés ci-dessus, les auteurs parlent davantage de PLS en tant que méthode SEM, mais pour moi, leurs critiques semblent également applicables à la régression PLS.
Réponses:
Aucun, ce sont des synonymes.
SEM est une forme de régression. La régression est toute méthode qui corrèle des variables indépendantes et dépendantes et inclut des méthodes qui utilisent plusieurs variables traitées comme des entités distinctes. SEM utilise spécifiquement les relations mathématiques entre les variables pour contraindre le modèle final, dans le cas de PLS, c'est la covariance. Ma compréhension est que la modélisation de chemin est un terme spécifique à un domaine (pas le mien, je suis un spectroscopiste comme vous).
Une excellente réfutation se trouve dans Henseler et al. 2013 Croyances communes et réalité à propos du PLS . Une préoccupation majeure pour Rönkkö et al. est que PLS n'a pas très bien fonctionné dans certaines situations qui supposent un facteur latent commun. Le PLS est en fait conçu pour gérer de multiples facteurs latents, une situation beaucoup plus courante dans le monde réel.
Comment fiable? Pour la spectroscopie, c'est un excellent outil mais il a ses limites. Il court le risque de sur-adapter car il peut construire des modèles complexes qui capturent les contributions de multiples facteurs sous-jacents. Pour cette raison, il doit être utilisé avec soin et une validation externe appropriée est essentielle, mais ces mises en garde s'appliquent à tous les outils de création de modèles. Je travaille principalement sur des ensembles de données du monde réel depuis 2 décennies et je n'ai rencontré aucun ensemble de données expérimental qui n'avait qu'un seul facteur commun sous-tendant la variable dépendante (ni basé sur des données ni sur une théorie scientifique).
la source