De nombreux fichiers PDF vont de moins à l'infini positif, mais certains moyens sont définis et d'autres non. Quel trait commun rend certains calculables?
distributions
mean
Kevin Nowaczyk
la source
la source
Réponses:
La moyenne d'une distribution est définie en termes d'intégrale (je l'écrirai comme pour une distribution continue - comme une intégrale de Riemann, disons - mais le problème s'applique plus généralement; nous pouvons procéder à l'intégration de Stieltjes ou de Lebesgue pour traiter correctement et tout à la fois):
Mais qu'est ce que ça veut dire? C'est effectivement un raccourci pour
ou
(bien que vous puissiez le casser n'importe où, pas seulement à 0)
Le problème survient lorsque les limites de ces intégrales ne sont pas finies.
Par exemple, considérons la densité de Cauchy standard, qui est proportionnelle à ... notez que11+x2
soit , donc d u = 2 xu=1+x2 du=2xdx
ce qui n'est pas fini. La limite dans la moitié inférieure n'est pas non plus finie; l'attente n'est donc pas définie.
Ou si nous avions comme variable aléatoire la valeur absolue d'un Cauchy standard, toute son attente serait proportionnelle à cette limite que nous venons de regarder (ie ).b → ∞lim12ln( 1 + b2)
En revanche, certaines autres densités continuent à "à l'infini" mais leur intégrale a une limite.
la source
Les autres réponses sont bonnes, mais pourraient ne pas convaincre tout le monde, en particulier les personnes qui jettent un coup d'œil à la distribution de Cauchy (avec ) et disent qu'il est toujours intuitivement évident que la moyenne devrait être nulle.x0=0
La raison pour laquelle la réponse intuitive n'est pas correcte du point de vue mathématique est due au théorème de réarrangement de Riemann (vidéo) .
En fait, ce que vous faites lorsque vous regardez un Cauchy et que vous dites que la moyenne "devrait être zéro", c'est que vous divisez le "centre" à zéro, puis que vous revendiquez les moments de l'équilibre des deux tailles. Ou en d'autres termes, vous faites implicitement une somme infinie avec "la moitié" des termes positifs (les moments à chaque point à droite) et "la moitié" des termes négatifs (les moments à chaque point à gauche) et vous le réclamez somme à zéro. (Pour ceux qui ont l'esprit technique: )∫∞0f(x0+r)rdr−∫∞0f(x0−r)rdr=0
Le théorème de réarrangement de Riemann dit que ce type de somme infinie (une avec des termes positifs et négatifs) n'est cohérent que si les deux séries (termes positifs uniquement et termes négatifs uniquement) sont chacune convergentes lorsqu'elles sont prises indépendamment. Si les deux côtés (positif et négatif) sont divergents par eux-mêmes, alors vous pouvez trouver un ordre de sommation des termes tel qu'il résume à n'importe quel nombre. (Vidéo ci-dessus, à partir de 6h50)
Donc, oui, si vous faites la sommation de manière équilibrée à partir de 0, les premiers moments de la distribution de Cauchy s'annulent. Cependant, la définition (standard) de la moyenne n'applique pas cet ordre de sommation. Vous devriez pouvoir résumer les moments dans n'importe quel ordre et les faire valider également. Par conséquent, la moyenne de la distribution de Cauchy n'est pas définie - en choisissant judicieusement la façon dont vous additionnez les moments, vous pouvez les faire «équilibrer» (ou non) à pratiquement n'importe quel point.
Ainsi, pour définir la moyenne d'une distribution, les deux intégrales des moments doivent chacune être indépendamment convergentes (finies) autour de la moyenne proposée (qui, lorsque vous faites le calcul, n'est vraiment qu'une autre façon de dire que l'intégrale complète ( ) doit être convergent). Si les queues sont suffisamment "grasses" pour rendre le moment infini d'un côté, vous avez terminé. Vous ne pouvez pas l'équilibrer avec un moment infini de l'autre côté.∫∞−∞f(x)xdx
Je dois mentionner que le comportement "contre-intuitif" de choses comme la distribution de Cauchy est entièrement dû à des problèmes lorsque l'on pense à l'infini. Prenez la distribution de Cauchy et coupez la queue - même arbitrairement loin, comme à plus / moins le nombre xkcd - et (une fois normalisé) vous obtenez soudainement quelque chose qui se comporte bien et a une moyenne définie. Ce ne sont pas les grosses queues en soi qui sont un problème, c'est leur comportement à l'approche de l'infini.
la source
Le général Abrial et Glen_b ont eu des réponses parfaites. Je veux juste ajouter une petite démo pour vous montrer que la moyenne de la distribution de Cauchy n'existe pas / ne converge pas.
Dans l'expérience suivante, vous verrez, même si vous obtenez un grand échantillon et calculez la moyenne empirique de l'échantillon, les chiffres sont assez différents d'une expérience à l'autre.
Vous pouvez observer que nous avons expériences, et dans chaque expérience, nous échantillonnons points à partir de deux distributions, avec un si grand échantillon, la moyenne empirique à travers différentes expériences devrait être assez proche de la vraie moyenne. Les résultats montrent que la distribution de Cauchy n'a pas de moyenne convergente, contrairement à la distribution normale.1 × 10 5100 1×105
ÉDITER:
Comme @ mark999 mentionné dans le chat, nous devrions argumenter que les deux distributions utilisées dans l'expérience ont une "variance" similaire (la raison pour laquelle j'utilise la citation est parce que la variance de la distribution de Cauchy n'est pas non plus définie.). Voici la justification: leurs PDF sont similaires.
Notez que, en regardant le PDF de la distribution de Cauchy, nous supposerions que c'est , mais d'après les expériences que nous pouvons voir, il n'existe pas. C'est le point de la démo.0
la source
Par définition de l'intégrale de Lebesgue-Stieltjes, la moyenne existe si:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
https://en.wikipedia.org/wiki/Lebesgue_integration
la source
La distribution de Cauchy est une forme déguisée d'une distribution très fondamentale, à savoir la distribution uniforme sur un cercle. Dans les formules, la probabilité infinitésimale est , où est la coordonnée angulaire. La probabilité (ou mesure) d'un arc est . Ceci est différent de la distribution uniforme , bien que les mesures soient en effet les mêmes pour les arcs ne contenant pas . Par exemple, sur l'arc de dans le sens antihoraire à , la moyenne de la distribution sur le cercle estθ A ⊂ S 1 l e n g t h ( A ) / 2 π U ( - π , π ) π π - εdθ/2π θ A⊂S1 length(A)/2π U(−π,π) π π−ε π U ( - π , π ) ε / 2 π−π+ε (=π+εmod2π) π . Mais la moyenne de la distribution uniforme sur l'union correspondante de deux intervalles disjoints, chacun de longueur , est nulle.U(−π,π) ε/2π
Puisque la distribution sur le cercle est symétrique en rotation, il ne peut pas y avoir de moyenne, de médiane ou de mode sur le cercle. De même, les moments supérieurs, tels que la variance, ne peuvent pas avoir de sens. Cette distribution se produit naturellement dans de nombreux contextes. Par exemple, mon projet actuel comprend des images au microscope de tissus cancéreux. Les très nombreux objets de l'image ne sont pas symétriques et une "direction" peut être assignée à chacun. L'hypothèse nulle évidente est que ces directions sont uniformément réparties.
Pour masquer la simplicité, soit le cercle d'unité standard, et soit . Nous définissons en fonction de par projection stéréographique du cercle de sur l' axe des . La formule est . En différenciant, on trouve . La probabilité infinitésimale est donc , la forme habituelle de la distribution de Cauchy, et "Hey, hop!", La simplicité devient un casse-tête, nécessitant un traitement par les subtilités de la théorie de l'intégration. p=(0,1)∈ S 1 xθpxS1 p=(0,1)∈S1 x θ p x x=tan(θ/2) dθ/2=dx/(1+x2) dθπ(1+x2)
Dans , nous pouvons ignorer l'absence de (en d'autres termes, rétablir ) pour toute considération telle qu'un moment d'ordre moyen ou supérieur, car la probabilité de (sa mesure) est nul. Donc la non-existence de la moyenne et des moments supérieurs se répercute sur la ligne réelle. Cependant, il y a maintenant un point spécial, à savoir , qui correspond à sous projection stéréographique et cela devient la médiane et le mode de la distribution de Cauchy.pp∈ S 1 p-p=(0,-1)0∈ RS1∖{p} p p∈S1 p −p=(0,−1) 0∈R
la source