Analyse de corrélation canonique avec corrélation de rang

15

L'analyse de corrélation canonique (ACC) vise à maximiser la corrélation produit-moment de Pearson habituelle (c.-à-d. Le coefficient de corrélation linéaire) des combinaisons linéaires des deux ensembles de données.

Maintenant, considérons le fait que ce coefficient de corrélation ne mesure que les associations linéaires - c'est la raison même pour laquelle nous utilisons également, par exemple, les coefficients de corrélation Spearman- ρ ou Kendall- τ (rang) qui mesurent des monotones arbitraires (pas nécessairement linéaires) connexion entre les variables.

Par conséquent, je pensais à ce qui suit: une limitation de l'ACC est qu'elle essaie seulement de capturer l'association linéaire entre les combinaisons linéaires formées en raison de sa fonction objective. Ne serait-il pas possible d'étendre l'ACC dans un certain sens en maximisant, disons, Spearman- ρ au lieu de Pearson- r ?

Une telle procédure aboutirait-elle à quelque chose de statistiquement interprétable et significatif? (Est-il sensé - par exemple - d'effectuer l'ACC dans les rangs ...?) Je me demande si cela aiderait lorsque nous traitons des données non normales ...

Tamas Ferenci
la source
4
Est-ce que OVERALS - analyse linéaire canonique des variables de façon optimale des échelles () transforme de façon monotone pour maximiser les corrélations canoniques - être à votre goût?
ttnphns
@ttnphns: Merci pour l'idée, je n'en ai jamais entendu parler auparavant, et ça a l'air vraiment intéressant! Cependant, je ne pense pas que cela règle le problème: à ma connaissance, il s'agit essentiellement d'une combinaison de mise à l'échelle optimale et de CCA - mais la mise à l'échelle optimale n'a vraiment de sens que pour les variables catégorielles. Cela ne semble pas beaucoup changer pour les variables continues mesurées sur l'échelle des ratios (que j'ai en tête!). Mais corrigez-moi, si je me trompe.
Tamas Ferenci
1
@ttnphns: Eh bien, de la même manière que vous utilisez parfois la corrélation Spearman sur des variables continues! (Bien sûr, il traite les données comme étant ordinales ... mais nous les utilisons néanmoins sur des variables définitivement continues pour caractériser l'association monotone générale (et pas seulement linéaire) entre les variables.) C'est pourquoi j'ai pensé que cela aurait également du sens au sein du CCA ...
Tamas Ferenci
@Glen_b, vous avez raison. Bien entendu, les corrélations de rang s'appliquent à toute monotonie - qu'il s'agisse de données ordinales ou continues. Je suis tellement surpris de mon propre commentaire ci-dessus que je le supprime.
ttnphns
Vous pouvez essayer d'utiliser Kernel CCA qui, spécifiquement lorsqu'il est utilisé avec des fonctions de base radiales, nous permet de projeter les données dans un sous-espace de dimension infinie.
roni

Réponses:

6

J'ai utilisé des extensions de splines cubiques restreintes lors du calcul de variables canoniques. Vous ajoutez des fonctions de base non linéaires à l'analyse exactement comme vous ajouteriez de nouvelles fonctionnalités. Il en résulte une analyse en composantes principales non linéaire. Voir la R Hmiscpackage de transcanfonction pour un exemple. Le homalspackage R va bien plus loin.

Frank Harrell
la source
1
Je vous remercie! L'approche décrite dans les homals était nouvelle pour moi, mais certainement intéressante.
Tamas Ferenci
4

La méthode standard de CCA fonctionne avec une matrice de coefficients de corrélation de moment de produit. Pour la plus grande mgnitude CC, il construit deux variables composites z1 (n) et z2 (n) par combinaison linéaire de deux matixes (avec n lignes et variables m1 et m2) de sorte que abs (corrélation (z1, z2)) soit maximisé. Cette fonction objective peut être maximisée directement même si la corrélation (z1, z2) n'est pas le moment du produit mais définie différemment.

Mishra, SK (2009) "Une note sur l'analyse de corrélation canonique ordinale de deux ensembles de scores de classement"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

SK Mishra
la source