Je jette ici le problème tel que je l'ai reçu.
J'ai deux variables aléatoires. L'un est continu (Y) et l'autre est discret et sera abordé comme ordinal (X). J'ai mis en dessous l'intrigue que j'ai reçue avec la requête.
La personne qui m'envoie les données veut mesurer la force de l'association entre X et Y. Je recherche des idées qui ne seraient pas chargées d'hypothèses sur le processus qui a généré les données. Notez qu'il ne s'agit pas de trouver un moyen non paramétrique pour tester la force de la relation (comme dans le bootstrap) mais de trouver un moyen non paramétrique pour la mesurer .
D'un autre côté, l'efficacité n'est pas un problème car il y a beaucoup de points de données.
Réponses:
Par définition, l' échelle ordinale est la jauge dans laquelle les distances réelles entre les encoches
1 2 3 4
sont inconnues. C'est comme si vous voyiez une règle sous la drogue / l'alcool. Les vraies distances peuvent être quelconques. Cela pourrait être1 2 3 4
ou1 2 3 4
ou quoi que ce soit. Nous ne pouvons pas calculer une statistique - telle qu'une corrélation - à moins de décider des distances, de les fixer.Il existe également d'autres approches. Mais de quelque façon que ce soit, nous transformons l'échelle ordinale de façon monotone "de manière à ..." (une hypothèse ou un objectif), parce que l'échelle ordinale nous est déformée d'une manière inconnue. Radicalement, une autre décision serait de "dégriser" en premier et de décider qu'elle n'est pas déformée (c'est-à-dire qu'elle est un intervalle), ou déformée de manière connue (n'est aucun intervalle), ou qu'elle est nominale.
Certaines approches asymétriques peuvent inclure une régression ordinale de la variable ordinale par l'autre (intervalle / continu). Ou régression linéaire de ce dernier par l'ordinal, avec le modèle où le prédicteur est pris comme contraste polynomial (c'est-à-dire entré comme
b1X + b2X^2 + b3X^3,...
). La faiblesse de ces approches est qu'elles sont asymétriques: une variable est dépendante, l'autre est indépendante.la source
Les références
Reshef, D., Reshef, Y., Finucane, H., Grossman, S., McVean, G., Turnbaugh, P., Lander, E., Mitzenmacher, M., et Sabeti, P. (2011). Détection de nouvelles associations dans de grands ensembles de données. Science , 334 (6062): 1518–1524.
Reshef, D., Reshef, Y., Mitzenmacher, M. et Sabeti, P. (2013). Analyse d'équitabilité du coefficient d'information maximal, avec comparaisons . arXiv , 14 août.
la source