J'ai entendu / vu à plusieurs endroits que vous pouvez transformer l'ensemble de données en quelque chose qui est distribué normalement en prenant le logarithme de chaque échantillon, calculer l'intervalle de confiance pour les données transformées et retransformer l'intervalle de confiance en utilisant l'opération inverse (par exemple, augmenter 10 à la puissance des bornes inférieure et supérieure, respectivement, pour ).
Cependant, je me méfie un peu de cette méthode, simplement parce qu'elle ne fonctionne pas pour la moyenne elle-même:
Quelle est la bonne façon de procéder? Si cela ne fonctionne pas pour la moyenne elle-même, comment peut-il fonctionner pour l'intervalle de confiance de la moyenne?
Réponses:
Il existe plusieurs façons de calculer les intervalles de confiance pour la moyenne d'une distribution lognormale. Je vais présenter deux méthodes: Bootstrap et Profile lik vraisemblance. Je présenterai également une discussion sur le Jeffreys avant.
Amorcer
Pour le MLE
Dans ce cas, les MLE de pour un échantillon sont(μ,σ) (x1,...,xn)
Ensuite, le MLE de la moyenne est . En rééchantillonnant, nous pouvons obtenir un échantillon bootstrap de et, en utilisant cela, nous pouvons calculer plusieurs intervalles de confiance bootstrap . Les codes suivants montrent comment les obtenir.δ^= exp( μ^+ σ^2/ 2) δδ^
R
Pour la moyenne de l'échantillon
Maintenant, considérant l'estimateur au lieu du MLE. D'autres types d'estimateurs pourraient également être envisagés.δ~= x¯
Probabilité de profil
Pour la définition des fonctions de vraisemblance et de vraisemblance de profil, voir . En utilisant la propriété d'invariance de la probabilité, nous pouvons reparamétrer comme suit , où , puis calculer numériquement le probabilité de profil de .( μ , σ) → ( δ, σ) δ= exp( μ + σ2/ 2) δ
Cette fonction prend des valeurs dans ; un intervalle de niveau a une confiance approximative de . Nous allons utiliser cette propriété pour construire un intervalle de confiance pour . Les codes suivants montrent comment obtenir cet intervalle .( 0 , 1 ] 0,147 95 % δ
R
Dans cette section, un algorithme alternatif, basé sur l'échantillonnage de Metropolis-Hastings et l'utilisation de l'a priori de Jeffreys, pour calculer un intervalle de crédibilité pour est présenté.δ
Rappelons que l'a priori de Jeffreys pour dans un modèle lognormal est( μ , σ)
et que ce prieur est invariant dans les reparameterisations. Cet a priori est incorrect, mais la partie postérieure des paramètres est correcte si la taille de l'échantillon . Le code suivant montre comment obtenir un intervalle de crédibilité de 95% à l'aide de ce modèle bayésien.n ≥ 2
R
Notez qu'ils sont très similaires.
la source
Vous pourriez essayer l'approche bayésienne avec le prieur de Jeffreys. Il devrait donner des intervalles de crédibilité avec une propriété d'appariement fréquentiste correcte: le niveau de confiance de l'intervalle de crédibilité est proche de son niveau de crédibilité.
la source
Vous avez raison - c'est la formule de la moyenne géométrique, pas la moyenne arithmétique. La moyenne arithmétique est un paramètre de la distribution normale et n'est souvent pas très significative pour les données lognormales. La moyenne géométrique est le paramètre correspondant de la distribution log-normale si vous voulez parler de manière plus significative d'une tendance centrale pour vos données.
Et vous calculeriez en effet les IC sur la moyenne géométrique en prenant les logarithmes des données, en calculant la moyenne et les IC comme d'habitude, et en retransformant. Vous avez raison de ne pas vraiment vouloir mélanger vos distributions en plaçant les IC de la moyenne géométrique autour de la moyenne arithmétique .... yeowch!
la source