Afficher l'estimation converge vers le centile grâce aux statistiques de commande

Soit une séquence de variables aléatoires iid échantillonnées à partir d'une distribution alpha stable , avec les paramètres . $X_1, X_2, \ldots, X_{3n}$ $\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0$

Considérons maintenant la séquence , où , pour . $Y_1, Y_2, \ldots, Y_{n}$ $Y_{j+1} = X_{3j+1}X_{3j+2}X_{3j+3} - 1$ $j=0, \ldots, n-1$

Je veux estimer le centile. $0.01-$

Mon idée est de faire une sorte de simulation Monte-Carlo:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

L' appel de la moyenne de l' ensemble de l'échantillon centiles calculée pour être et leur variance , pour calculer l'intervalle de confiance approprié pour , je recours à la forme forte du théorème central limite : $0.01-$ $\hat{\mu}_n$ $\hat{\sigma}^{2}_{n}$ $\mu$

Soit une suite de iid variables aléatoires avec et . Définir la moyenne échantillon . $X_1, X_2, \ldots$ $E \left[ X_i \right] = \mu$ $0 < V \left[ X_i \right] = \sigma^2 < \infty$ $\hat{\mu}_n = (1/n) \sum_{i=1}^n X_i$ a une distribution normale standard limite, c'est-à-dire $(\hat{\mu}_n - \mu) / \sqrt{\sigma^{2}/n}$
$\frac{{\hat{μ}}_{n} - μ}{\sqrt{σ^{2} / n}} \overset{n \to \infty}{⟶} N (0, 1) .$ $\frac{\hat{\mu}_n - \mu}{\sqrt{\sigma^{2}/n}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

et le théorème de Slutksy pour conclure que

\sqrt{n} \frac{{\hat{μ}}_{n} - μ}{\sqrt{{\hat{σ}}_{n}^{2}}} \overset{n \to \infty}{⟶} N (0, 1) .

$\sqrt{n} \frac{\hat{\mu}_n - \mu}{\sqrt{\hat{\sigma}^{2}_{n}}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

Alors un intervalle de confiance pour est $(1-\alpha)\times 100\%$ $\mu$

I_{α} = [{\hat{μ}}_{n} - z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}, {\hat{μ}}_{n} + z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}],

$I_{\alpha} = \left[\hat{\mu}_n - z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} , \hat{\mu}_n + z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} \right],$ où est le -quantile de la distribution normale standard.

z_{1 - α / 2}

$z_{1- \alpha / 2}$

(1 - α / 2)

$(1- \alpha / 2)$

Des questions:

1) Mon approche est-elle correcte? Comment puis-je justifier l'application du CLT? Je veux dire, comment puis-je montrer que la variance est finie? (Dois-je regarder la variance de ? Parce que je ne pense pas que ce soit fini ...) $Y_j$

2) Comment puis-je montrer que la moyenne de tous les échantillons $0.01-$ centiles calculé converge vers la valeur réelle du percentile? (Je devrais utiliser les statistiques de commande mais je ne sais pas comment procéder; les références sont appréciées.) $0.01-$

probability self-study monte-carlo convergence order-statistics Maya
la source

Toutes les méthodes appliquées aux échantillons de médianes sur stats.stackexchange.com/questions/45124 s'appliquent également aux autres centiles. En effet, votre question est identique à celle-ci mais remplace simplement le 50e centile par le 1er (ou 0,01 peut-être?) Centile.

whuber

@whuber, votre réponse à cette question est extrêmement bonne. cependant, Glen_b déclare, à la fin de son article (la réponse acceptée), que la normalité approximative "ne s'applique pas aux quantiles extrêmes, parce que le CLT n'y entre pas en jeu (la moyenne des Z ne sera pas asymptotiquement normale Vous avez besoin d'une théorie différente pour les valeurs extrêmes ". Dans quelle mesure devrais-je m'inquiéter de cette déclaration?

Maya

Je crois qu'il ne voulait pas vraiment dire des quantiles extrêmes , mais seulement les extrêmes eux-mêmes. (En fait, il a corrigé ce laps de temps à la fin de la même phrase, les qualifiant de «valeurs extrêmes».) La distinction est qu'un quantile extrême, tel que le centile 0,01 (qui marque le 1/10000e inférieur de la dans la limite, se stabilisera parce que de plus en plus de données dans un échantillon tomberont toujours en dessous et de plus en plus tomberont au-dessus de ce centile. Avec un extrême (comme le maximum ou le minimum) ce n'est plus le cas.

whuber

C'est un problème qui devrait être résolu en général en utilisant la théorie des processus empiriques. Une aide sur votre niveau de formation serait utile.

AdamO

La variance de n'est pas finie. $Y$ En effet , une variable alpha-stable avec (une répartition Holtzmark ) n'a une attente finie mais sa variance est infinie. Si avait une variance finie , alors en exploitant l'indépendance du et la définition de la variance, nous pourrions calculer $X$ $\alpha=3/2$ $\mu$ $Y$ $\sigma^2$ $X_i$

\begin{aligned} σ^{2} = Var (Y) & = E (Y^{2}) - E (Y)^{2} \\ = E (X_{1}^{2} X_{2}^{2} X_{3}^{2}) - E (X_{1} X_{2} X_{3})^{2} \\ = E (X^{2})^{3} - {(E (X)^{3})}^{2} \\ = {(Var (X) + E (X)^{2})}^{3} - μ^{6} \\ = {(Var (X) + μ^{2})}^{3} - μ^{6} . \end{aligned}

$\eqalign{ \sigma^2 = \operatorname{Var}(Y) &= \mathbb{E}(Y^2) - \mathbb{E}(Y)^2 \\ &= \mathbb{E}(X_1^2X_2^2X_3^2) - \mathbb{E}(X_1X_2X_3)^2 \\ &= \mathbb{E}(X^2)^3 - \left(\mathbb{E}(X)^3\right)^2 \\ &= \left(\operatorname{Var}(X) + \mathbb{E}(X)^2\right)^3 - \mu^6 \\ &= \left(\operatorname{Var}(X) + \mu^2\right)^3 - \mu^6. }$

$\operatorname{Var}(X)$ $\operatorname{Var}(X)$

Passons à la deuxième question.

Tout quantile d'échantillon converge vers le vrai quantile lorsque l'échantillon grandit. Les paragraphes suivants prouvent ce point général.

$q=0.01$ $0$ $1$ $F$ $Z_q=F^{-1}(q)$ $q^{\text{th}}$

$F^{-1}$ $\epsilon\gt 0$ $q_-\lt q$ $q_+\gt q$

F (Z_{q} - ϵ) = q_{-}, F (Z_{q} + ϵ) = q_{+},

$F(Z_q - \epsilon) = q_-,\quad F(Z_q + \epsilon) = q_+,$

$\epsilon\to 0$ $[q_-, q_+]$ $\{q\}$

$n$ $Z_{q_-}$ $(q_-, n)$ $q_-$ $Z_{q_-}$ $n$ $Z_{q_-}$ $nq_-$ $nq_-(1-q_-)$ $\Phi$ $nq$

1 - Φ (\frac{n q - n q_{-}}{\sqrt{n q_{-} (1 - q_{-})}}) = 1 - Φ (\sqrt{n} \frac{q - q_{-}}{\sqrt{q_{-} (1 - q_{-})}}) .

$1-\Phi\left(\frac{nq - nq_-}{\sqrt{nq_-(1-q_-)}}\right) = 1-\Phi\left(\sqrt{n}\frac{q - q_-}{\sqrt{q_-(1-q_-)}}\right).$

$\Phi$ $\sqrt{n}$ $n$ $\Phi$ $1$

$nq$ $Z_{q_-}$ $nq$ $Z_{q_+}$ $q$ $Z_q-\epsilon$ $Z_q+\epsilon$

$\epsilon$ $1-\alpha$ $n$ $nq$ $1-\alpha$ $\epsilon$ $Z_q$

$q=0.50$

$q=0.01$ $Y$ $n=300$ $Y$

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)

whuber
la source

Afficher l'estimation converge vers le centile grâce aux statistiques de commande

Réponses: