Nous entendons toujours parler de ce vecteur de données VS de cet autre vecteur de données indépendant les uns des autres, ou non corrélé, etc., et bien qu'il soit facile de trouver le calcul concernant ces deux concepts, je veux les relier à des exemples de la vie, et aussi trouver des moyens de mesurer cette relation.
De ce point de vue, je cherche des exemples de deux signaux qui sont des combinaisons suivantes: (je vais commencer par certains):
Deux signaux indépendants ET (nécessairement) non corrélés:
- Le bruit d'un moteur de voiture (appelez-le ) et votre voix ( v 2 [ n ] ) pendant que vous parlez.
- Un enregistrement de l'humidité tous les jours ( ) et l'indice Dow Jones ( v 2 [ n ] ).
Q1) Comment mesureriez-vous / prouveriez-vous qu'ils sont indépendants avec ces deux vecteurs en main? Nous savons que l'indépendance signifie que le produit de leurs pdfs est égal à leur pdf commun, et c'est très bien, mais avec ces deux vecteurs en main, comment peut-on prouver leur indépendance?
- Deux signaux qui ne sont PAS indépendants, mais toujours non corrélés:
Q2) Je ne peux pas penser à des exemples ici ... quels seraient certains exemples? Je sais que nous pouvons mesurer la corrélation en prenant la corrélation croisée de deux de ces vecteurs, mais comment pourrions-nous prouver qu'ils ne sont PAS non plus indépendants?
- Deux signaux corrélés:
- Un vecteur mesurant la voix d'une chanteuse d'opéra dans le hall principal, , tandis que quelqu'un enregistre sa voix quelque part à l'intérieur du bâtiment, disons dans la salle de répétition ( v 2 [ n ] ).
- Si vous avez continuellement mesuré votre fréquence cardiaque dans votre voiture, ( ), et également mesuré l'intensité des lumières bleues frappant votre pare-brise arrière ( v 2 [ n ] ) ... Je suppose que celles-ci seraient très corrélées ... :-)
Q3) Relatif à q2, mais dans le cas de la mesure de la corrélation croisée à partir de ce point de vue empirique, est-il suffisant de regarder le produit scalaire de ces vecteurs (puisque c'est la valeur au sommet de leur corrélation croisée)? Pourquoi nous soucierions-nous des autres valeurs de la fonction de corrélation croisée?
Merci encore, plus il y a d'exemples, mieux c'est pour construire l'intuition!
Réponses:
Quelques éléments ... (je sais que ce n'est pas exhaustif, une réponse plus complète devrait sans doute mentionner des moments)
Q1
Pour vérifier si deux distributions sont indépendantes, vous devez mesurer à quel point leur distribution conjointe est similaire au produit de leur distribution marginale p ( x ) × p ( y ) . À cette fin, vous pouvez utiliser n'importe quelle distance entre les distributions. Si vous utilisez la divergence Kullback-Leibler pour comparer ces distributions, vous considérerez la quantité:p(x,y) p(x)×p(y)
Et vous aurez reconnu ... l'Information Mutuelle! Plus elle est faible, plus les variables sont indépendantes.
Plus concrètement, pour calculer cette quantité à partir de vos observations, vous pouvez soit estimer les densités , p ( y ) , p ( x , y ) à partir de vos données à l'aide d'un estimateur de densité Kernel et effectuer une intégration numérique sur une grille fine ; ou simplement quantifier vos données en N cases et utiliser l'expression des informations mutuelles pour des distributions discrètes.p(x) p(y) p(x,y) N
Q2
De la page Wikipedia sur l'indépendance statistique et la corrélation:
À l'exception du dernier exemple, ces distributions 2D ont des distributions marginales p ( x ) et p ( y ) non corrélées (matrice de covariance diagonale), mais non indépendantes .p(x,y) p(x) p(y)
Q3
Il existe en effet des situations dans lesquelles vous pouvez regarder toutes les valeurs des fonctions de corrélation croisée. Ils surviennent, par exemple, dans le traitement du signal audio. Considérons deux microphones capturant la même source, mais distants de quelques mètres. La corrélation croisée des deux signaux aura un fort pic au décalage correspondant à la distance entre les microphones divisée par la vitesse du son. Si vous regardez simplement la corrélation croisée au décalage 0, vous ne verrez pas qu'un signal est une version décalée dans le temps de l'autre!
la source
Il est très difficile de déterminer si deux signaux sont indépendants (compte tenu des observations finies) sans connaissances / hypothèses préalables.
Exemple :
la source