J'essaie de quantifier le degré d'inflation (c.-à-d. La meilleure façon dont les points de données observés correspondent aux attentes). Une façon est aussi de regarder le tracé QQ. Mais je voudrais calculer un indicateur numérique de l'inflation - signifie que l'adéquation de l'observé correspond à la distribution uniforme théorique.
Exemples de données:
# random uniform distribution
pvalue <- runif(100, min=0, max=1)
# with inflation expected i.e. not uniform distribution
pvalue1 <- rnorm(100, mean = 0.5, sd=0.1)
probability
distributions
qq-plot
rdorlearn
la source
la source
Réponses:
Il existe différentes façons de tester la déviation de toute distribution (uniforme dans votre cas):
(1) Tests non paramétriques:
Vous pouvez utiliser les tests de Kolmogorov-Smirnov pour voir la distribution des valeurs observées s'ajuster aux attentes.
R a une
ks.test
fonction qui peut effectuer le test de Kolmogorov-Smirnov.(2) Test de qualité d'ajustement du chi carré
Dans ce cas, nous catégorisons les données. Nous notons les fréquences observées et attendues dans chaque cellule ou catégorie. Pour le cas continu, les données peuvent être classées en créant des intervalles artificiels (bacs).
(3) Lambda
Si vous effectuez une étude d'association à l'échelle du génome (GWAS), vous souhaiterez peut-être calculer le facteur d'inflation génomique , également appelé lambda (λ) ( voir également ). Ces statistiques sont populaires dans la communauté de la génétique statistique. Par définition, λ est défini comme la médiane des statistiques de test du chi carré résultant divisée par la médiane attendue de la distribution du chi carré. La médiane d'une distribution chi carré avec un degré de liberté est de 0,4549364. Une valeur λ peut être calculée à partir des scores z, des statistiques du chi carré ou des valeurs p, en fonction des résultats de l'analyse d'association. Parfois, la proportion de la valeur p de la queue supérieure est rejetée.
Pour les valeurs p, vous pouvez le faire en:
Si l'analyse aboutit, vos données suivent la distribution normale du chi carré (pas d'inflation), la valeur λ attendue est 1. Si la valeur λ est supérieure à 1, cela peut être la preuve d'un biais systématique qui doit être corrigé dans votre analyse .
La lambda peut également être estimée à l'aide d'une analyse de régression.
Une autre méthode pour calculer lambda utilise 'KS' (optimisation de l'ajustement de la distribution chi2.1df en utilisant le test de Kolmogorov-Smirnov).
la source