La notation intégrale de Riemann-Stieltjes est utilisée dans les expressions d'attente dans certains textes de probabilité. Fondamentalement, dF (x) apparaît dans l'intégrale plutôt que f (x) dx dans l'intégrale, car le CDF F (x) peut ne pas être différenciable pour une distribution discrète.
La motivation que j'ai entendue pour cela est généralement de fournir une définition unifiée de l'attente plutôt que de la traiter avec un cas discret et un cas continu. Il est également censé faciliter la réflexion sur les mélanges discrets et continus. Mais je n'ai jamais vu d'exemple de calcul d'une attente avec une intégrale de Riemann-Stieltjes pour une distribution discrète (ou pour une distribution qui soit un mélange d'une masse ponctuelle et d'une distribution continue).
Quelqu'un peut-il donner un exemple des deux ou l'un ou l'autre? Merci!
Réponses:
Puisque vous ne semblez pas avoir fait beaucoup avec l'intégrale, je vais en discuter de manière très élémentaire (et légèrement ondulée) qui devrait transmettre quelque chose de ce qui se passe. Cependant, vous voudrez peut-être commencer par un rappel, en jetant un œil à la définition d'une intégrale de Stieltjes, voir, par exemple Mathworld ou Wikipedia . Faire les intégrales correctement implique de considérer la limite dans la définition, et dans les cas où ce n'est pas évident, c'est vraiment ce que vous devez faire.
Si la distribution est purement discrète,réF est 0, sauf aux sauts, où il est p ( x ) - donc pour les cas discrets l'intégrale est littéralement la somme habituelle.
À titre d'exemple, considérons un Bernoulli (0,4).
Donc, pour cet exemple,E( X) =∫∞- ∞XréF=∑XXp ( x ) . (Ce n'est pas seulement "ils ont une valeur égale" mais "ces choses sont des façons différentes d'exprimer la même chose"; je devrais probablement utiliser un symbole plus approprié.)
Alors voilàréF est 0 partout mais à x = 0 (où réF est 0,6 ) et x = 1 (où c'est 0,4 ). Donc, cette expression est juste0 ⋅ 0,6 + 1 ⋅ 0,4 .
Bien que l'unification de formules discrètes et continues soit soignée, ce n'est pas vraiment là que la plus grande partie de sa valeur me vient à l'esprit. Je vois plus de valeur dans le fait qu'elle s'applique aux cas où vous n'avez ni variables aléatoires discrètes ni continues - et il y a de nombreux cas où c'est quelque chose que vous rencontrez avec des données réelles, donc ce n'est pas un problème théorique ésotérique. Avoir une notation capable de gérer en douceur ces cas «ni discrets ni continus» ainsi que les cas spéciaux discrets et continus en même temps, c'est là qu'il y a un réel avantage.
Prenons un cas simple et agréable qui n'est ni l'un ni l'autre, par exemple, une distribution des précipitations quotidiennes pour un mois et un lieu donnés, peut-être modélisée comme un mélange d'une probabilité de0,6 de zéro pluie et les quantités de pluie non nulles étant lognormales( μ ,σ2) (où μ = 1,384 ,et σ= 1,823 ) (qui pourrait être appelé un modèle «lognormal gonflé à zéro»)
Ensuite, dans ce cas, une intégrale telle que celle de l'attente,E(X)=∫∞−∞xdF peut être traité assez facilement, car il fonctionne comme la définition discrète jusqu'à et à ce saut (en ajoutant seulement x.p(x) au saut, qui se révèle ajouter 0 à l'intégrale, puisque tout cela 0.6 la probabilité était de x=0 ) puis dans ce cas partout au-dessus 0 (parce que la fonction est assez agréable pour que Stieltjes soit le même que Riemann ordinaire) le reste fonctionne comme une intégrale de Riemann de x⋅f(x) au dessus de 0 , tant que nous gardons à l'esprit que dF est plus petit qu'il ne le serait pour le lognormal (ci-dessus 0 tu peux voir F est "écrasé" par rapport à un cdf pur-lognormal), ce qui représente exactement la probabilité (0.4 ) de dépassement 0 ici.
Bien sûr, cela fonctionne bien pour plus que justeg(x)=x ; Je prends simplement des cas simples pour montrer un peu ce qui se passe. (Whuber a montré un bel exemple dans les commentaires, où il fait un calcul MGF pour un problème non simple, où la distribution se termine comme une distribution mixte)
Même juste avec ces très belles fonctions (où vous pouvez les traiter comme Riemann où elles sont continues, ce qui est un sous-ensemble des cas couverts par Stieltjes), il y a une infinité de cas dans de tels mélanges (plutôt que simplement 'discrets' ou 'continus' ) qui peut être géré par cette seule notation.
Une référence utile qui utilise largement cette intégrale pour afficher ou discuter d'une variété de résultats est Advanced Theory of Statistics (Kendall et Stuart - ou dans des éditions plus récentes, Stuart et Ord). Ne laissez pas le titre vous effrayer, c'est un livre très lisible.
Donc, si vous (par exemple) jouez avec des intégrales tout en regardant par exemple une inégalité de Chebyshev, vous ne faites pas seulement un cas discret et un cas continu en même temps ... vous couvrez toute distribution pour laquelle l'intégrale de Stieltjes fonctionne - donc si vous vous demandez ce qui se passe à Tchebychev si vous avez une distribution comme disons celle des précipitations, voilà, tout est pris en charge par ce même développement. Et si demain, votre ami arrive avec une bêta gonflée de zéro, eh bien, vous l'avez déjà couvert également. Etc ...
[Si vous vous trouvez dans une situation où vous ne pouvez pas voir immédiatement ce que signifie l'intégrale, revenez à la définition et suivez-la.]
(Cette belle intégrale peut être remplacée par des éléments capables de gérer des situations encore plus larges - à des fins statistiques, généralement à l' intégrale de Lebesgue ou Lesbesgue-Stieltjes )
la source