Le modèle sous - jacent de PLS est qu'une donnée matrice X et n vecteur y sont liés par X = T P ' + E , y = T q ' + f , où T est un latent n × k matrice, et E , f sont des termes de bruit (en supposant que X , y sont centrés).
PLS produit des estimations de , et un 'raccourci' vecteur des coefficients de régression, ß tels que y ~ X β . Je voudrais trouver la distribution de β sous certaines hypothèses simplificatrices, qui devrait probablement inclure les éléments suivants:
- Le modèle est correct, c'est -à- dire pour T , P , q inconnu ;
- Le nombre de facteurs latents, , est connu et utilisé dans l'algorithme PLS;
- Les termes d'erreur réels sont normaux à moyenne nulle avec des variances connues;
Cette question est quelque peu sous-définie car il existe des dizaines de variantes de «l'algorithme PLS», mais j'accepterais des résultats pour chacune d'entre elles. J'accepte également des conseils sur la façon d'estimer la distribution de β par exemple une amorce, mais peut - être est une question distincte.