Je suis curieux de savoir s'il existe une transformation qui modifie l'inclinaison d'une variable aléatoire sans affecter la kurtosis. Cela serait analogue à la façon dont une transformation affine d'un RV affecte la moyenne et la variance, mais pas le biais et le kurtosis (en partie parce que le biais et le kurtosis sont définis comme étant invariants aux changements d'échelle). Est-ce un problème connu?
data-transformation
random-variable
moments
shabbychef
la source
la source
Réponses:
Ma réponse est le début d'un hack total, mais je ne connais aucun moyen établi de faire ce que vous demandez.
Ma première étape serait de classer par ordre votre ensemble de données, vous pouvez trouver la position proportionnelle dans votre ensemble de données, puis la transformer en une distribution normale, cette méthode a été utilisée dans Reynolds et Hewitt, 1996. Voir l'exemple de code R ci-dessous dans PROCMiracle.
Une fois que la distribution est normale, le problème a été inversé - une question d'ajustement du kurtosis mais pas de l'inclinaison. Une recherche sur Google a suggéré que l'on pouvait suivre les procédures de John & Draper, 1980 pour ajuster le kurtosis mais pas l'inclinaison - mais je n'ai pas pu reproduire ce résultat.
Mes tentatives de développer une fonction d'étalement / rétrécissement brut qui prend la valeur d'entrée (normalisée) et en ajoute ou en soustrait une valeur proportionnelle à la position de la variable sur l'échelle normale entraîne un ajustement monotone, mais en pratique, a tendance à créer une distribution bimodale bien que présentant les valeurs d'asymétrie et de kurtosis souhaitées.
Je me rends compte que ce n'est pas une réponse complète, mais j'ai pensé que cela pourrait fournir un pas dans la bonne direction.
la source
Une autre technique intéressante est venue à l'esprit, bien que cela ne réponde pas tout à fait à la question, est de transformer un échantillon pour avoir un échantillon L-skew fixe et un échantillon L-kurtosis (ainsi qu'une moyenne fixe et une échelle L). Ces quatre contraintes sont linéaires dans les statistiques d'ordre. Pour garder la transformée monotone sur un échantillon de observations, il faudrait alors encore équations. Cela pourrait alors être posé comme un problème d'optimisation quadratique: minimiser len - 1 ℓ 2n n−1 ℓ2 norme entre les statistiques d'ordre d'échantillon et la version transformée soumise aux contraintes données. C'est une sorte d'approche farfelue, cependant. Dans la question d'origine, je cherchais quelque chose de plus basique et fondamental. Je cherchais également implicitement une technique qui pourrait être appliquée à des observations individuelles, indépendamment d'avoir une cohorte entière d'échantillons.
la source
Je préfère modéliser cet ensemble de données en utilisant une distribution leptokurtic au lieu d'utiliser des transformations de données. J'aime la distribution sinh-arcsinh de Jones et Pewsey (2009), Biometrika.
la source