Pourquoi la distribution de Cauchy n'a pas de moyen?

109

À partir de la fonction de densité de distribution, nous pourrions identifier une moyenne (= 0) pour la distribution de Cauchy, comme le montre le graphique ci-dessous. Mais pourquoi dit-on que la distribution de Cauchy n'a pas de moyen?

entrez la description de l'image ici

Cochon volant
la source
2
Je recommande la référence Cabeza G., UA. (2013). Le média de la distribution de Cauchy. Dans le blog Apoyo en Matemáticas sur la moyenne de distribution de Cauchy.
Voir
kjetil b halvorsen

Réponses:

99

Vous pouvez vérifier mécaniquement que la valeur attendue n'existe pas, mais cela doit être physiquement intuitif, du moins si vous acceptez le principe de Huygens et la loi des grands nombres . La conclusion de la loi des grands nombres échoue pour une distribution de Cauchy, elle ne peut donc pas avoir de moyen. Si vous faites la moyenne de variables aléatoires de Cauchy indépendantes, le résultat ne converge pas vers car avec une probabilité de . Il reste une distribution de Cauchy de la même taille. Ceci est important en optique.0 n 1n0n1

La distribution de Cauchy est l'intensité normalisée de la lumière sur une ligne provenant d'une source ponctuelle. Le principe de Huygens dit que vous pouvez déterminer l'intensité en supposant que la lumière est réémise par n'importe quelle ligne entre la source et la cible. Ainsi, l'intensité de la lumière sur une ligne située à mètres peut être déterminée en supposant que la lumière frappe d'abord une ligne située à mètre et qu'elle est réémise à n'importe quel angle. L'intensité de la lumière sur une ligne située à une distance de mètres peut être exprimée par la convolution à fois la distribution de la lumière sur une ligne située à mètre de distance. C'est-à-dire que la somme de distributions de Cauchy indépendantes est une distribution de Cauchy échelonnée par un facteur de .2n n 1 n n1nn1nn

Si la distribution de Cauchy avait une moyenne, alors le e centile de la convolution à fois divisé par devrait converger vers selon la loi des grands nombres. Au lieu de cela, il reste constant. Si vous marquez le e centile sur une ligne (transparente) à mètre de distance, à mètres de distance, etc., ces points forment une ligne droite à degrés. Ils ne se plient pas vers .n n 0 25 1 2 45 025nn02512450

Cela vous parle de la distribution de Cauchy en particulier, mais vous devez connaître le test de l'intégrale car il existe d'autres distributions sans moyenne qui n'ont pas une interprétation physique claire.

Douglas Zare
la source
39
+1 Maintenant, il y a une réponse éclairante :-) (désolé). En passant, le principe est nommé pour Christiaan Huygens, pas Huygen. Huygens fut le premier à apprécier les nouveaux développements en matière de probabilité publiés dans les années 1650 par Pascal (sur la base de ses lettres à Fermat): c'était le compte rendu de ces idées par Huygens (1657), y compris celui de l'espérance, qui avait à l'origine une théorie de la probabilité mathématique. pied et a ouvert la voie au traité séminal (posthume) de Jakob Bernoulli ( Ars Conjectandi , 1713).
whuber
4
Les amplitudes sont propagées, pas les intensités.
Doru Constantin
2
C'est une excellente réponse, mais je trouve la fin confuse: "... marquez le 25e centile sur ... une ligne droite, à 45 degrés. Ils ne se plient pas vers 0." La déclaration elle-même est vraie (en conséquence du principe de Huygens-Fresnel), mais c'est avant "divisé par ". Lorsque vous divisez par 2 à 2 mètres, divisé par 3 à 3 mètres, ..., la ligne transparente est verticale (perpendiculaire à l'écran qui capte la lumière). La ligne de quantile à 45 degrés appartient à la somme de Cauchy et n'aide pas (encore) à argumenter. n
Lee David Chung Lin
40

Réponse ajoutée en réponse au commentaire de @ whuber sur la réponse de Michael Chernicks (et complètement réécrite pour supprimer l'erreur signalée par whuber.)

La valeur de l'intégrale pour la valeur attendue d'une variable aléatoire de Cauchy est dite non définie car la valeur peut être "faite" pour être ce que l'on aime. L'intégrale (interprétée dans le sens d'une intégrale de Riemann) est ce qu'on appelle communément une intégrale impropre et sa valeur doivent être calculées comme valeur limite: ou

xπ(1+x2)dx
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
et bien sûr, les deux évaluations devraient donner la même valeur finie. Sinon, l'intégrale est dite non définie. Cela montre immédiatement pourquoi la moyenne de la variable aléatoire de Cauchy est dite indéfinie: la valeur limite dans la limite interne diverge.

La valeur principale de Cauchy est obtenue sous la forme d'une limite unique: au lieu de la double limite ci-dessus. La valeur principale de l'intégrale de l' attente est facilement considérée comme depuis la limitand a une valeur pour tous . Mais cela ne peut pas être utilisé pour dire que la moyenne d'une variable aléatoire de Cauchy est . C'est-à-dire que la moyenne est définie comme la valeur de l'intégrale au sens habituel et non au sens principal.

limTTTxπ(1+x2)dx
00T0

Pour , considérons l’intégrale qui se rapproche d'une valeur limite de comme . Lorsque , nous obtenons la valeur principale décrite ci-dessus. Ainsi, nous ne pouvons pas attribuer un sens non ambigu à l'expressionα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
sans spécifier comment les deux infinis ont été abordés, et ignorer ce point conduit à tout sortes de complications et de résultats incorrects car les choses ne sont pas toujours ce qu’elles paraissent quand le lait de la valeur principale se fait passer pour la crème de la valeur. C'est pourquoi la moyenne de la variable aléatoire de Cauchy est dite non définie plutôt que d'avoir la valeur , la valeur principale de l'intégrale.0

Si l’on utilise l’approche théorique de la probabilité et que l’intégrale de la valeur attendue est définie au sens d’une intégrale de Lebesgue, la question est alors plus simple. n'existe que lorsque est fini, et donc est indéfini pour une variable aléatoire de Cauchy puisque n'est pas fini.g|g|E[X]XE[|X|]

Dilip Sarwate
la source
9
L'évaluation de l'intégrale du milieu est incorrecte: c'est zéro, pas un logarithme. Le problème réside en réalité dans l’évaluation des deux limites implicites dans les intégrales infinies.
whuber
@ Whuber Merci d'avoir signalé l'erreur. J'ai complètement réécrit ma réponse et votre commentaire ne s'applique plus.
Dilip Sarwate
Je ne comprends pas pourquoi l'attente du ratio n'existe pas. Si et sont conjointement distribués normalement avec une moyenne différente de zéro, alors la moyenne de est donnée par , qu'est-ce qui me manque? XYZ=XYxyp(x,y)dxdy
Royi
@ Drazick Je n'ai pas mentionné le rapport de deux variables aléatoires normales nulle part dans ma réponse. Veuillez demander à quelqu'un qui a soulevé cette question en ce qui concerne les variables aléatoires de Cauchy.
Dilip Sarwate
2
@ Drazick Vérifiez si votre intégrale existe ou non . En général, si la densité de est continue dans un voisinage de , E [X ^ {- 1}] $ n'existe pas. X0
Dilip Sarwate
33

Bien que les réponses ci-dessus soient des explications valables sur les raisons pour lesquelles la distribution de Cauchy n’a aucune attente, je trouve que le rapport de deux variables normales indépendantes est tout aussi éclairant: nous avoir et la seconde attente est .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+
Xi'an
la source
1
Est-ce queune variable aléatoire de Cauchy 'pliée' quand je sais que est le standard de Cauchy? Comment trouver la distribution de? |X1X2|X1X2|X1X2|
StubbornAtom
1
Oui, c'est la valeur absolue d'une variable de Cauchy, qui a donc la densité sur les nombres réels positifs. f(x)+f(x)
Xi'an
Si vous pliez la distribution normale, alorsn'est pas l'infini? E1/|X2|
Albert Chen
C'est l'infini.
Xi'an le
22

Le Cauchy n'a pas de moyenne car le point que vous sélectionnez (0) n'est pas une moyenne. C'est une médiane et un mode . La moyenne d'une distribution absolument continue est définie comme où est la fonction de densité et l'intégrale est prise sur le domaine de (qui est to dans le cas de Cauchy). Pour la densité de Cauchy, cette intégrale n'est simplement pas finie (la moitié de à est et la moitié de à est ).xf(x)dxff00

Michael Chernick
la source
9
Je ne vous critique pas, @Dilip: j'augmente votre observation. Ce qui est très intéressant, c’est que l’existence d’une valeur principale nulle pourrait nous inciter à définir la moyenne de la distribution de Cauchy (ou la moyenne de tout RV) comme la valeur principale de l’intégrale. Cela approfondit beaucoup la nature de cette question, qui est occultée en déclarant que l'intégrale est soit infinie, soit indéfinie: à savoir, pourquoi la valeur principale ne fonctionne-t-elle pas ? Pourquoi ne serait-il pas légitime d’utiliser cela comme moyen?
whuber
5
@whuber Il est également intéressant de noter que si vous tronquez l'intégrale en -a et + a pour tout a> 0, vous obtenez 0. Donc, en prenant la limite comme une approche de l'intégrale symétrique, vous obtenez 0. Une autre raison de demander pourquoi ne l'est pas 0 la moyenne.
Michael Chernick
10
@whuber: Je prends votre dernière question dans votre avant-dernière remarque rhétorique; en tout cas, nous voulons une convergence absolue et "la" raison dans mon esprit est que nous voulons que les choses se comportent comme des zones. En particulier, nous devons pouvoir découper des éléments (fonctions) en éléments et les réorganiser à volonté sans perturber la réponse obtenue. Nous ne pouvons pas couper et réorganiser cette fonction pour une fonction linéaire par rapport à une distribution de Cauchy, nous devons donc insister sur le fait que sa moyenne n’existe pas.
cardinal
9
Ceci, @ cardinal, est une bonne réponse! Je n'étais pas simplement rhétorique, parce que la question elle-même demande: "Pourquoi disons-nous que la distribution de Cauchy n'a pas de moyen?" Affirmer que l'attente est indéfinie peut satisfaire l'inconnu, mais la possibilité qu'une définition alternative raisonnable de l'intégrale puisse exister - et donner une réponse intuitivement correcte! - devrait troubler les gens. Votre réponse est proche de ce que j'avais en tête, mais elle reste incomplète. Je pense qu'une réponse satisfaisante identifierait d'importants théorèmes de la théorie statistique qui échouent lorsque nous travaillons avec des intégrales conditionnellement convergentes.
whuber
7
@Dilip, je le pensais aussi, mais après réflexion, trouvez que cela est un peu plus difficile que ce que vous semblez suggérer. Par exemple, le théorème de la limite centrale ne pose pas de problème: le fait d'exiger un écart garantit automatiquement une attente, bien sûr. Et beaucoup de théorèmes sont prouvés en utilisant l'inégalité de Chebyshev, où une fois de plus nous sommes garantis d'une moyenne. Donc, je suis vraiment curieux: quels sont les grands théorèmes utilisés dans la pratique de la statistique où nous devons vraiment être conscients des problèmes liés aux attentes conditionnellement convergentes, mais non convergentes?
whuber
16

Il est préférable de considérer la distribution de Cauchy comme la distribution uniforme sur un cercle unitaire. Il serait donc surprenant que le calcul de la moyenne ait un sens. Supposons que soit une sorte de "fonction de moyennage". Autrement dit, supposons que, pour chaque sous-ensemble fini du cercle unité, était un point du cercle unité. Clairement, doit être "non naturel". Plus précisément, ne peut pas être équivariant en ce qui concerne les rotations. Pour obtenir la distribution de Cauchy sous sa forme plus usuelle, mais moins révélatrice, projetez l'unité du cercle sur l'axe des x à partir de (0,1) et utilisez cette projection pour transférer la distribution uniforme du cercle sur l'axe des x.fXf(X)ff

Pour comprendre pourquoi la moyenne n'existe pas, considérons x comme une fonction du cercle unité. Il est assez facile de trouver un nombre infini d'arcs disjoints sur le cercle unitaire, tels que, si l'un des arcs a une longueur d, alors x> 1/4 d sur cet arc. Ainsi, chacun de ces arcs disjoints contribue pour plus de 1/4 à la moyenne, et la contribution totale de ces arcs est infinie. Nous pouvons refaire la même chose, mais avec x <-1 / 4d, avec une contribution totale moins l'infini. Ces intervalles peuvent être affichés avec un diagramme, mais peut-on créer des diagrammes pour la validation croisée?

David Epstein
la source
1
Bienvenue sur le site, DavidEpstein. Vous pouvez créer des images avec votre logiciel préféré et les télécharger dans votre réponse en cliquant sur la petite icône d'image (pour lancer l'assistant) au-dessus du champ de réponse. Malheureusement, cependant, vous avez besoin de> = 10 représentants pour le faire. Je suis sûr que vous l'aurez assez tôt. dans l’intervalle, si vous pouvez poster l’image n'importe où sur Internet et poster un lien vers celle-ci dans votre réponse, un utilisateur de représentant supérieur peut la récupérer et la poster pour vous.
gung - Réintégrer Monica
3
Je ne savais pas que Cauchy était interprété comme un uniforme sur un cercle, mais cela a du sens. Un argument topologique montre qu'il ne peut y avoir de fonction continue sur un cercle ayant les propriétés d'une fonction de moyennage.
johnny
@ DavidEpstein, j'ai également lu votre réponse dans l'autre message . La projection stéréographique est vraiment sympa. En comparaison, pouvez-vous expliquer pourquoi la projection radiale tout aussi valable d'un demi-cercle n'implique pas que le moyen soit bien défini? À savoir, , alors est le standard de Cauchy. Géométriquement, c’est le fait fondamental qu’un angle inscrit correspond toujours à la moitié de son angle central correspondant. X tan ( π ( U - 1UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin
En fait, en ce qui concerne le modèle physique d'une source de lumière, l'image en demi-cercle est plus appropriée, car on ne comprend pas immédiatement pourquoi le principe de Huygens vous donnerait une projection stéréographique.
Lee David Chung Lin
10

La moyenne ou la valeur attendue d’une variable aléatoire est une intégrale de Lebesgue définie sur une mesure de probabilité : P E X = X d PXP

EX=XdP

La non-existence de la moyenne de la variable aléatoire de Cauchy signifie simplement que l'intégrale de Cauchy rv n'existe pas. En effet, les queues de distribution de Cauchy sont des queues lourdes (à comparer aux queues de distribution normale). Cependant, la non-existence de la valeur attendue n'interdit pas l'existence d'autres fonctions d'une variable aléatoire de Cauchy.

Tomas
la source
5
Les queues sont "lourdes" en ce sens qu'elles ne se désintègrent pas assez rapidement dans les deux sens pour faire converger l'intégrale. Ce concept n'a rien à voir avec les distributions normales (ou toute distribution de référence).
whuber
4
Oui, merci pour cette correction. Je n'ai pas eu l'intention d'impliquer une connexion rigoureuse entre les queues lourdes et la distribution normale. Cependant, je pense que comparer la distribution normale (avec les queues légères) et la distribution à queues épaisses rend visuellement (pas toujours) un peu plus facile à comprendre le concept des queues "lourdes".
Tomas
5

Voici plus d'une explication visuelle. (Pour ceux d'entre nous qui ont des difficultés en mathématiques.). Prenez un générateur de nombres aléatoires répartis de Cauchy et essayez de calculer la moyenne des valeurs obtenues. Voici une bonne page sur une fonction pour cela. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Vous constaterez que la "densité" des valeurs aléatoires la rend plus grande au fur et à mesure que vous disparaissez. . Par conséquent, il n'a pas de moyen.

Paul
la source
4

Pour compléter les excellentes réponses, je ferai quelques commentaires sur la raison pour laquelle la non-convergence de l'intégrale est pertinente pour la pratique statistique. Comme d’autres l’ont mentionné, si nous permettions à la valeur principale d’être une "moyenne", les scripts ne sont plus valables! Indépendamment de cela, réfléchissez aux conséquences du fait que, dans la pratique, tous les modèles sont des approximations. Plus précisément, la distribution de Cauchy est un modèle pour une variable aléatoire non bornée. En pratique, les variables aléatoires sont limitées, mais les limites sont souvent vagues et incertaines. Utiliser des modèles non bornés est un moyen d’atténuer cet inconvénient, cela rend inutile l’introduction de limites incertaines (et souvent non naturelles) dans les modèles. Mais pour que cela ait un sens, les aspects importants du problème ne doivent pas être affectés. Cela signifie que, si nous devions introduire des limites, cela ne devrait pas altérer de manière importante le modèle. Mais lorsque l'intégrale est non convergente, cela ne se produit pas! Le modèle est instable, en ce sens que l'attente de la RV dépendrait de limites largement arbitraires. (Dans les applications, il n'y a pas nécessairement de raison de rendre les limites symétriques!)

Pour cette raison, il est préférable de dire que l'intégrale est divergente que de dire qu'elle est "infinie", la dernière étant proche d'impliquer une valeur définie quand aucune n'existe! Une discussion plus approfondie est ici .

kjetil b halvorsen
la source
-4

Je voulais être un peu difficile pendant une seconde. Le graphique en haut est faux. L'axe des x est en écarts-types, ce qui n'existe pas pour la distribution de Cauchy. Je suis pointilleux parce que j'utilise la distribution Cauchy tous les jours de ma vie dans mon travail. Il existe un cas pratique où la confusion pourrait causer une erreur empirique. La distribution t de Student avec 1 degré de liberté est la norme de Cauchy. Il listera généralement les différents sigmas nécessaires à la signification. Ces sigmas ne sont PAS des écarts-types, ce sont des erreurs probables et mu est le mode.

Si vous souhaitez utiliser correctement le graphique ci-dessus, que l'axe des x soit constitué de données brutes ou que vous souhaitiez des erreurs de taille équivalente, vous devez leur attribuer des erreurs probables égales. Une erreur probable est 0,67 écart-type de taille sur la distribution normale. Dans les deux cas, il s’agit de la plage semi-interquartile.

Maintenant, pour répondre à votre question, tout ce que tout le monde a écrit ci-dessus est correct, et c’est la raison mathématique. Cependant, je soupçonne que vous êtes un étudiant et que vous êtes nouveau dans le sujet. Les solutions mathématiques contre-intuitives à l'évidence visuelle risquent donc de ne pas sembler vraies.

J'ai deux échantillons du monde réel presque identiques, tirés d'une distribution de Cauchy, qui ont tous deux le même mode et la même erreur probable. L'un a une moyenne de 1,27 et l'autre une moyenne de 1,33. Celui avec une moyenne de 1,27 a un écart-type de 400, celui avec une moyenne de 1,33 a un écart-type de 5,15. L'erreur probable pour les deux est de 0,32 et le mode est de 1. Cela signifie que pour les données symétriques, la moyenne n'est pas dans les 50% centraux. Une seule observation supplémentaire suffit pour que la moyenne et / ou la variance ne soient plus significatives pour un test. La raison en est que la moyenne et la variance ne sont pas des paramètres et que la moyenne et la variance de l'échantillon sont elles-mêmes des nombres aléatoires.

La réponse la plus simple est que les paramètres de la distribution de Cauchy n'incluent pas de moyenne et, par conséquent, aucune variance autour d'une moyenne.

Il est probable que dans votre pédagogie passée, l’importance de la moyenne était qu’elle était généralement une statistique suffisante. Dans les statistiques à long terme basées sur les fréquences, la distribution de Cauchy n'a pas de statistique suffisante. Il est vrai que la médiane de l’échantillon, pour une distribution de Cauchy avec un support sur l’ensemble des réels, est une statistique suffisante, mais c’est parce qu’elle en hérite comme statistique d’ordre. C'est en quelque sorte suffisant, faute d'un moyen facile d'y penser. Maintenant, dans les statistiques bayésiennes, il existe une statistique suffisante pour les paramètres de la distribution de Cauchy et si vous utilisez un précédent uniforme, il est également impartial. Je soulève cette question parce que si vous devez les utiliser quotidiennement, vous avez appris toutes les méthodes pour les évaluer.

Aucune statistique d'ordre valide ne peut être utilisée comme estimateur pour les distributions de Cauchy tronquées, ce que vous rencontrerez probablement dans le monde réel. Il n'y a donc pas de statistique suffisante dans les méthodes basées sur la fréquence pour la plupart des applications du monde réel, mais pas pour toutes. .

Ce que je suggère, c’est de s’éloigner de la moyenne, mentalement, en tant que réalité. C'est un outil, comme un marteau, qui est très utile et peut généralement être utilisé. Parfois, cet outil ne fonctionne pas.

Une note mathématique sur les distributions normale et de Cauchy. Lorsque les données sont reçues sous forme de série chronologique, la distribution normale ne se produit que lorsque les erreurs convergent vers zéro lorsque t va à l'infini. Lorsque les données sont reçues sous forme de série chronologique, la distribution de Cauchy se produit lorsque les erreurs divergent à l'infini. L'une est due à une série convergente, l'autre à une série divergente. Les distributions de Cauchy n'arrivent jamais à un point précis de la limite, elles basculent d'un point à l'autre de telle sorte que 50% du temps, elles sont d'un côté et 50% du temps de l'autre. Il n'y a pas de retour médian.

DE Harris
la source
9
Il y a une certaine confusion dans cette réponse! Par exemple, il est indiqué "Dans les statistiques bayésiennes, il existe une statistique suffisante pour les paramètres de la distribution de Cauchy et si vous utilisez une version antérieure uniforme, elle est également non biaisée". Il est difficile de donner un sens à cela! Premièrement, les concepts de suffisance Frequentist et Bayesian sont très proches (et je crois qu’ils ne peuvent différer que dans des espaces d’échantillons étranges et infinis, de sorte que la ligne réelle est la même). Il n'y a pas de statistique suffisante pour le modèle de Cauchy, de dimension fixe !, simplement (les données complètes sont évidemment suffisantes).
kjetil b halvorsen
-6

Pour le dire simplement, la zone sous la courbe se rapproche de l'infini lorsque vous effectuez un zoom arrière. Si vous échantillonnez une région finie, vous pouvez trouver une moyenne pour cette région. Cependant, il n'y a pas de moyen pour l'infini.

Paul
la source
8
L'aire sous le PDF est égale à , par définition, vous devez donc signifier autre chose par "la courbe". Qu'Est-ce que c'est? 1
whuber