Pourquoi la distribution de Cauchy est-elle si utile?

16

Quelqu'un pourrait-il me donner des exemples pratiques de la distribution de Cauchy? Qu'est-ce qui le rend si populaire?

Maria Lavrovskaya
la source
3
Je remets en question la prémisse - est-il réellement populaire comme modèle pratique *? (Si c'est le cas, comment le savez-vous, en dehors de voir déjà des exemples pratiques?) ...* [Il est largement utilisé dans les exemples de manuels en raison de sa simplicité et comme contre-exemple de diverses choses, mais je doute que ceux-ci soient pratiques. Il est parfois utilisé comme un précédent, mais ce n'est pas un modèle de données.]
Glen_b -Reinstate Monica
J'ai vu quelques exemples pratiques de mon domaine d'études, spécifiquement pour l'algorithme MCMC. Par conséquent, je suis curieux de savoir si elle peut être appliquée pour le financement ou le ML
Maria Lavrovskaya
Lorsque vous dites «pour l'algorithme MCMC», voulez-vous plutôt dire «en tant que précédent bayésien» ou voulez-vous dire «en tant que modèle de données dans un cadre bayésien» ou autre chose?
Glen_b -Reinstate Monica
Pour le calcul de la priorité hiérarchique et de la priorité de référence.
Maria Lavrovskaya
2
Son utilisation comme a priori est due aux propriétés de la distribution (en général, l'objectif est de donner une sorte de a priori faiblement informatif); d'après le libellé de la question, je n'aurais pas pensé que vous vouliez inclure les prieurs. Il y a une question quelque peu connexe ici: quelles sont les propriétés d'une distribution à moitié de Cauchy?
Glen_b -Reinstate Monica

Réponses:

19

En plus de son utilité en physique, la distribution de Cauchy est couramment utilisée dans les modèles en finance pour représenter les écarts de rendement par rapport au modèle prédictif. La raison en est que les praticiens de la finance hésitent à utiliser des modèles qui ont des distributions à queue légère (par exemple, la distribution normale) sur leurs rendements, et ils préfèrent généralement aller dans l'autre sens et utiliser une distribution avec des queues très lourdes (par exemple , le Cauchy). L'histoire de la finance est jonchée de prédictions catastrophiques basées sur des modèles qui n'avaient pas la queue assez lourde dans leurs distributions. La distribution de Cauchy a des queues suffisamment lourdes pour que ses moments n'existent pas, et c'est donc un candidat idéal pour donner un terme d'erreur avec des queues extrêmement lourdes.

Notons que cette question de l'adiposité des queues en termes d'erreur dans les modèles financiers était l'un des principaux contenus de la critique populaire de Taleb (2007) . Dans ce livre, Taleb souligne les cas où les modèles financiers ont utilisé la distribution normale pour les termes d'erreur, et il note que cela sous-estime la vraie probabilité d'événements extrêmes, qui sont particulièrement importants en finance. (À mon avis, ce livre donne une critique exagérée, car les modèles utilisant des déviations à queue lourde sont en fait assez courants en finance. En tout cas, la popularité de ce livre montre l'importance de la question.)

Réintégrer Monica
la source
Merci, j'apprécie beaucoup votre réponse car je connais bien le livre. Soit dit en passant, je ne suis pas sûr de bien comprendre cette partie de votre phrase "gras de la queue en termes d'erreur". Pourriez-vous être plus précis à ce sujet?
Maria Lavrovskaya
Dans ce genre de discussion générale, nous n'avons pas de propriété de queue spécifique à l'esprit, donc la précision dans la spécification de la signification de «gras» ou de «lourdeur» des queues nuit à la généralité. Il vaut la peine de revoir certaines caractérisations des distributions à queue épaisse et des distributions à queue lourde pour voir le type de propriétés que j'ai en tête.
Rétablir Monica le
Pourriez-vous expliquer ce que signifie la précision dans un anglais simple? Je veux dire, je comprends que c'est l'inverse de la variance, mais je cherche à comprendre pourquoi si nous parlons de priors, nous obtenons n0 au dénominateur - la taille de l'échantillon précédent.
Maria Lavrovskaya
Sans voir le contexte de ce dont vous parlez, ce que vous demandez n'est pas clair. Puis-je vous suggérer de poser cela comme une nouvelle question sur ce site, avec tout le contexte pertinent donné.
Rétablir Monica le
25

XN(0,1)OuiN(0,1)XOuiCauchy(0,1)

La distribution de Cauchy est importante en physique (où elle est connue sous le nom de distribution de Lorentz) car c'est la solution à l'équation différentielle décrivant la résonance forcée. En spectroscopie, c'est la description de la forme des raies spectrales soumises à un élargissement homogène dans lequel tous les atomes interagissent de la même manière avec la plage de fréquence contenue dans la forme des raies.

Applications:

  • Utilisé en théorie mécanique et électrique, anthropologie physique et problèmes de mesure et d'étalonnage.

  • En physique, on l'appelle une distribution lorentzienne, où il s'agit de la distribution de l'énergie d'un état instable en mécanique quantique.

  • Également utilisé pour modéliser les points d'impact d'une ligne droite fixe de particules émises par une source ponctuelle.

Source .

Matthew Anderson
la source
Je vous remercie. La première phrase est assez utile. Je suis assez loin de la physique, pourriez-vous donner des exemples en matière de finance ou de machine learning?
Maria Lavrovskaya
2
Ce n'est pas vraiment utilisé en finance ou en machine learning (pratiquement); il est utilisé en physique (99,9% du temps). Je suppose que si quelqu'un voulait modéliser le rapport entre deux variables indépendantes normalement distribuées en finance, il utiliserait la distribution de Cauchy.
Matthew Anderson
2
Une raison pour laquelle il pourrait être utile en finance est qu'il a des queues extrêmement lourdes. Il n'a pas de moments, il n'est donc pas logique de dire qu'il a un kurtosis élevé, mais il est sujet à des observations extrêmes, hautes et basses.
Dave
7
Il est utilisé dans l'apprentissage automatique, en particulier comme distribution préalable dans l'inférence bayésienne. En particulier, le demi-Cauchy est utilisé comme a priori pour certaines variables d'échelle.
Wayne
2
@Wayne Pourriez-vous s'il vous plaît donner un exemple, peut-être une référence?
Dave