L'analyse de corrélation canonique (ACC) vise à maximiser la corrélation produit-moment de Pearson habituelle (c.-à-d. Le coefficient de corrélation linéaire) des combinaisons linéaires des deux ensembles de données.
Maintenant, considérons le fait que ce coefficient de corrélation ne mesure que les associations linéaires - c'est la raison même pour laquelle nous utilisons également, par exemple, les coefficients de corrélation Spearman- ou Kendall- (rang) qui mesurent des monotones arbitraires (pas nécessairement linéaires) connexion entre les variables.
Par conséquent, je pensais à ce qui suit: une limitation de l'ACC est qu'elle essaie seulement de capturer l'association linéaire entre les combinaisons linéaires formées en raison de sa fonction objective. Ne serait-il pas possible d'étendre l'ACC dans un certain sens en maximisant, disons, Spearman- au lieu de Pearson- ?
Une telle procédure aboutirait-elle à quelque chose de statistiquement interprétable et significatif? (Est-il sensé - par exemple - d'effectuer l'ACC dans les rangs ...?) Je me demande si cela aiderait lorsque nous traitons des données non normales ...
la source
Réponses:
J'ai utilisé des extensions de splines cubiques restreintes lors du calcul de variables canoniques. Vous ajoutez des fonctions de base non linéaires à l'analyse exactement comme vous ajouteriez de nouvelles fonctionnalités. Il en résulte une analyse en composantes principales non linéaire. Voir la R
Hmisc
package detranscan
fonction pour un exemple. Lehomals
package R va bien plus loin.la source
La méthode standard de CCA fonctionne avec une matrice de coefficients de corrélation de moment de produit. Pour la plus grande mgnitude CC, il construit deux variables composites z1 (n) et z2 (n) par combinaison linéaire de deux matixes (avec n lignes et variables m1 et m2) de sorte que abs (corrélation (z1, z2)) soit maximisé. Cette fonction objective peut être maximisée directement même si la corrélation (z1, z2) n'est pas le moment du produit mais définie différemment.
Mishra, SK (2009) "Une note sur l'analyse de corrélation canonique ordinale de deux ensembles de scores de classement"
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
la source