Comment calculer les intervalles de confiance sur les coefficients de régression en PLS?

10

Le modèle sous - jacent de PLS est qu'une donnée matrice X et n vecteur y sont liés par X = T P ' + E , y = T q ' + f ,T est un latent n × k matrice, et E , f sont des termes de bruit (en supposant que X , y sont centrés).n×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS produit des estimations de , et un 'raccourci' vecteur des coefficients de régression, ß tels que y ~ X β . Je voudrais trouver la distribution de β sous certaines hypothèses simplificatrices, qui devrait probablement inclure les éléments suivants:T,P,qβ^yXβ^β^

  1. Le modèle est correct, c'est -à- dire pour T , P , q inconnu ;X=TP+E,y=Tq+fT,P,q
  2. Le nombre de facteurs latents, , est connu et utilisé dans l'algorithme PLS;k
  3. Les termes d'erreur réels sont normaux à moyenne nulle avec des variances connues;

Cette question est quelque peu sous-définie car il existe des dizaines de variantes de «l'algorithme PLS», mais j'accepterais des résultats pour chacune d'entre elles. J'accepte également des conseils sur la façon d'estimer la distribution de β par exemple une amorce, mais peut - être est une question distincte.β^

shabbychef
la source

Réponses:

9

Connaissez-vous cet article: PLS-régression: un outil de base de la chimiométrie ? La dérivation de SE et CI pour les paramètres PLS est décrite au §3.11.

Je m'appuie généralement sur Bootstrap pour calculer les IC, comme suggéré par exemple dans Abdi, H. Régression des moindres carrés partiels et projection sur la régression de la structure latente (régression PLS) . Je semble me souvenir qu'il y a des solutions théoriques discutées dans Tenenhaus M. (1998) La régression PLS: Théorie et pratique (Technip), mais je ne peux pas vérifier pour l'instant car je n'ai pas le livre. Pour l'instant, il existe des packages R utiles, comme plsRglm .

PS Je viens de découvrir l'article de Nicole Krämer , en référence au package plsdof R.

chl
la source
2

J'ai découvert un article de Reiss, et. Al. , Calcul de l'intervalle de confiance des moindres carrés partiels pour la prédiction de qualité industrielle en fin de lot , dans lequel apparaît la citation:

La prédiction PLS doit être accompagnée d'un intervalle de con fi ance en ligne pour indiquer la précision de la prédiction. La formulation de l'intervalle de con fi ance pour la prédiction PLS est un domaine d'étude qui n'a pas abouti à un «étalon or».

Cet article contient une référence à `` l'excellente enquête sur ces travaux '', Erreur standard de prédiction pour PLS multi-voies , par Faber et Bro, et un article par Faber et Kowalski, Propagation des erreurs de mesure pour la validation des prédictions obtenues par régression en composantes principales et moindres carrés partiels . Je résumerai ces résultats dès qu'ils seront disponibles ...

shabbychef
la source
(+1) Bon à savoir, merci. Je devrais regarder à nouveau dans le travail de Michel Tenenhaus - je vous ferai savoir si je trouve ça intéressant.
chl