Y a-t-il une distribution en forme de plateau?

30

Je recherche une distribution où la densité de probabilité diminue rapidement après un certain point loin de la moyenne, ou selon mes propres mots une "distribution en forme de plateau".

Quelque chose entre le gaussien et l'uniforme.

distributions normal-distribution uniform dontloo
la source

8

Vous pouvez additionner un RV gaussien et un RV uniforme.

StrongBad

3

On entend parfois parler de distributions dites platykurtiques .

JM n'est pas statisticien

53

Vous recherchez peut-être une distribution connue sous les noms de distribution généralisée normale (version 1) , de distribution Subbotin ou de distribution d'énergie exponentielle. Il est paramétré par emplacement , échelle et forme avec pdf $\mu$ $\sigma$ $\beta$

\frac{β}{2 σ Γ (1 / β)} \exp [- {(\frac{| x - μ |}{σ})}^{β}]

$\frac{\beta}{2\sigma\Gamma(1/\beta)} \exp\left[-\left(\frac{|x-\mu|}{\sigma}\right)^{\beta}\right]$

comme vous pouvez le constater, pour il ressemble et converge vers la distribution de Laplace, avec il converge vers la normale, et quand vers une distribution uniforme. $\beta=1$ $\beta=2$ $\beta = \infty$

Si vous recherchez un logiciel qui l'a implémenté, vous pouvez vérifier la normalpbibliothèque pour R (Mineo et Ruggieri, 2005). Ce qui est bien avec ce paquet, c'est qu'il implémente entre autres la régression avec des erreurs généralisées normalement distribuées, c'est-à-dire en minimisant la norme . $L_p$

Mineo, AM et Ruggieri, M. (2005). Un outil logiciel pour la distribution d'énergie exponentielle: le package normalp. Journal of Statistical Software, 12 (4), 1-24.

Tim
la source

20

Le commentaire de StrongBad est une très bonne suggestion. La somme d'un RV uniforme et d'un RV gaussien peut vous donner exactement ce que vous recherchez si vous choisissez les bons paramètres. Et il a en fait une solution de forme fermée assez agréable.

Le pdf de cette variable est donné par l'expression:

\frac{1}{4 une} [e r F (\frac{X + une}{σ \sqrt{2}}) - e r F (\frac{X - une}{σ \sqrt{2}})]

$\dfrac{1}{4a}\left[\mathrm{erf}\left(\dfrac{x+a}{\sigma\sqrt{2}}\right)-\mathrm{erf}\left(\dfrac{x-a}{\sigma\sqrt{2}}\right) \right]$

$a$ est le "rayon" du RV uniforme à moyenne nulle. est l'écart type du RV gaussien à moyenne nulle. $\sigma$

Steve Cox
la source

3

Référence: Bhattacharjee, GP, Pandit, SNN et Mohan, R. 1963. Chaînes dimensionnelles impliquant des distributions d'erreur rectangulaires et normales. Technometrics, 5, 404–406.

Tim

15

Il existe un nombre infini de distributions "en forme de plateau".

Étiez-vous après quelque chose de plus spécifique que "entre le gaussien et l'uniforme"? C'est un peu vague.

En voici une simple: vous pouvez toujours coller une demi-normale à chaque extrémité d'un uniforme:

Vous pouvez contrôler la "largeur" de l'uniforme par rapport à l'échelle de la normale afin d'avoir des plateaux plus larges ou plus étroits, donnant toute une classe de distributions, qui incluent le gaussien et l'uniforme comme cas limites.

La densité est:

$\frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu+w/2)^2} \mathbb{I}_{x\leq \mu-w/2} \\ + \:\frac{h}{\sqrt{2\pi}\sigma}\quad\mathbb{I}_{\mu-w/2< x\leq \mu+w/2} \\ + \frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu-w/2)^2} \mathbb{I}_{x > \mu+w/2}$

où $h = \frac{1}{1 + w/(\sqrt{2\pi}\sigma)}$

Comme pour fixe , nous approchons l'uniforme sur et comme pour fixe nous approchons . $\sigma \to 0$ $w$ $(\mu-w/2,\mu+w/2)$ $w \to 0$ $\sigma$ $N(\mu,\sigma^2)$

Voici quelques exemples (avec dans chaque cas): $\mu=0$

On pourrait peut-être appeler cette densité un "uniforme à queue gaussienne".

Glen_b -Reinstate Monica
la source

1

Ach! J'aime assister à des balles officielles portant un uniforme Gausian à queue! ;)

Alexis

7

Voir ma distribution "Devil's tower" ici [1]:

$f(x) = 0.3334$ , pour ; , pour ; et , pour. $|x| < 0.9399$
$f(x) = 0.2945/x^2$ $0.9399 \leq |x| < 2.3242$
$f(x) = 0$ $2.3242 \leq |x|$

La distribution "slip-dress" est encore plus intéressante.

Il est facile de construire des distributions ayant la forme que vous souhaitez.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191-195. doi: 10.1080 / 00031305.2014.917055
accès public pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf

Peter Westfall
la source

Salut Peter - J'ai pris la liberté de donner la fonction et d'insérer une image ainsi que de donner une référence complète. (Si ma mémoire est bonne, je pense que Kendall et Stuart donnent les détails d'un démystification similaire dans leur texte classique. Si je me souviens bien - cela fait longtemps - je crois qu'ils discutent également du fait que ce n'est pas de la lourdeur)

Glen_b -Reinstate Monica

Merci, Glen_b. Je n'ai jamais dit que le kurtosis mesurait ce que mesuraient les nombres d'indice de queue. Au contraire, mon article prouve que le kurtosis est, pour une classe de distributions très large, presque égal à E (Z ^ 4 * I (| Z |> 1)). Ainsi, le kurtosis ne vous dit clairement rien sur le «pic», qui se trouve généralement dans la plage {Z: | Z | <1}. Il est plutôt déterminé principalement par les queues. Appelez-le E (Z ^ 4 * I (| Z |> 1)) si le terme "lourdeur" a une autre signification.

Peter Westfall

De plus, @Glen_b à quel index de queue faites-vous référence? Il y en a infiniment. Les croisements de queue ne définissent pas correctement la «queue». Selon certaines définitions de la lourdeur de la queue qui traversent la queue, N (0,1) est plus "à queue lourde" que .9999 * U (-1,1) + .0001 * U (-1000,1000), bien que cette dernière soit évidemment à queue plus lourde, malgré des queues finies. Et, BTW, ce dernier a un kurtosis extrêmement élevé, contrairement à N (0,1).

Peter Westfall

Je ne peux pas me trouver disant "index de queue" n'importe où dans mon commentaire; Je ne sais pas trop de quoi vous parlez là-bas lorsque vous dites "à quel indice de queue faites-vous référence". Si vous voulez parler de la lourdeur, la meilleure chose à faire est de vérifier ce que Kendall et Stuart disent réellement; Je crois que là-bas, ils comparent en fait le rapport asymptotique des densités pour les variables standardisées symétriques, mais il pourrait peut-être s'agir de fonctions de survivant; le point était le leur, pas le mien

Glen_b -Reinstate Monica

Étrange. Eh bien, de toute façon, Kendall et Stuart se sont trompés. Le kurtosis est évidemment une mesure du poids de la queue comme le prouvent mes théorèmes.

Peter Westfall

5

Beaucoup de bonnes réponses. La solution proposée ici a 2 caractéristiques: (i) qu'elle a une forme fonctionnelle particulièrement simple, et (ii) que la distribution résultante produit nécessairement un pdf en forme de plateau (et pas seulement comme un cas spécial). Je ne sais pas si cela a déjà un nom dans la littérature, mais même absent, appelons-le une distribution Plateau avec pdf : $f(x)$

F (X) = k \frac{1}{1 + X^{2 une}} pour X \in R

$f(x) = k \frac{1}{1 + x^{2 a}} \quad \quad \text{for } x \in \mathbb{R}$

où:

le paramètre est un entier positif, et $a$
$k$ est une constante d'intégration: $k = \frac{a}{\pi} \sin \left(\frac{\pi}{2 a}\right)$

Voici un tracé du pdf, pour différentes valeurs du paramètre : $a$

.

Lorsque le paramètre devient grand, la densité tend vers une distribution uniforme (-1,1). Le graphique suivant se compare également à un Normal standard (en pointillés gris): $a$

Wolfies
la source

3

Un autre ( EDIT : je l'ai simplifié maintenant. EDIT2 : je l'ai encore simplifié, bien que maintenant l'image ne reflète pas vraiment cette équation exacte):

F (X) = \frac{1}{3 \cdot α} \cdot bûche (\frac{matraque (α \cdot une) + matraque (α \cdot X)}{matraque (α \cdot b) + matraque (α \cdot X)})

$f(x) = \frac{1}{3 \cdot \alpha} \cdot \log{\left( \frac{\cosh{\left(\alpha \cdot a\right)}+ \cosh{\left(\alpha \cdot x\right)}} {\cosh{\left(\alpha \cdot b\right)}+ \cosh{\left(\alpha \cdot x\right)}} \right)}$

Clunky, je sais, mais ici j'ai profité du fait que s'approche d'une ligne lorsque augmente. $\log(\cosh(x))$ $x$

Fondamentalement, vous contrôlez la fluidité de la transition ( ). Si et je garantis que c'est une densité de probabilité valide (somme à 1). Si vous choisissez d'autres valeurs, vous devrez le renormaliser. $alpha$ $a = 2$ $b = 1$

Voici un exemple de code dans R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fest notre distribution. Tracons-le pour une séquence dex

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Sortie console:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Et l'intrigue:

Vous pouvez changer aet bapproximativement le début et la fin de la pente respectivement, mais une normalisation supplémentaire serait nécessaire, et je ne l'ai pas calculée (c'est pourquoi j'utilise a = 2et b = 1dans l'intrigue).

Pyromane
la source

2

Si vous cherchez quelque chose de très simple, avec un plateau central et les côtés d'une distribution triangulaire, vous pouvez par exemple combiner N distributions triangulaires, N selon le rapport souhaité entre le plateau et la descente. Pourquoi des triangles, car leurs fonctions d'échantillonnage existent déjà dans la plupart des langues. Vous triez au hasard à partir de l'un d'eux.

En R, cela donnerait:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

agenis
la source

2

En voici une jolie: le produit de deux fonctions logistiques.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Cela a l'avantage de ne pas être fragmentaire.

B ajuste la largeur et A ajuste la pente de la chute. Ci-dessous, B = 1: 6 avec A = 2. Remarque: je n'ai pas pris le temps de comprendre comment normaliser correctement cela.

Adjwilley
la source

Y a-t-il une distribution en forme de plateau?

Réponses: