Quelle est la différence entre les diagrammes de probabilité, les diagrammes PP et les diagrammes QQ lorsque vous essayez d'analyser une distribution ajustée aux données?
39
Quelle est la différence entre les diagrammes de probabilité, les diagrammes PP et les diagrammes QQ lorsque vous essayez d'analyser une distribution ajustée aux données?
Réponses:
Comme @ vector07 le note , le diagramme de probabilité est la catégorie la plus abstraite dont les diagrammes pp et qq sont membres. Ainsi, je discuterai de la distinction entre les deux derniers. La meilleure façon de comprendre les différences est de réfléchir à leur construction et de comprendre qu'il faut reconnaître la différence entre les quantiles d'une distribution et la proportion de la distribution que vous avez traversée lorsque vous atteignez un quantile donné. Vous pouvez voir la relation entre ceux-ci en traçant la fonction de distribution cumulative (CDF) d'une distribution. Par exemple, considérons la distribution normale standard:
Nous voyons qu'environ 68% de l'axe des y (région située entre les lignes rouges) correspond à 1/3 de l'axe des x (région située entre les lignes bleues). Cela signifie que lorsque nous utilisons la proportion de la distribution que nous avons traversée pour évaluer la correspondance entre deux distributions (c'est-à-dire que nous utilisons un graphique en pp), nous obtiendrons beaucoup de résolution au centre des distributions, mais moins à les queues. En revanche, lorsque nous utilisons les quantiles pour évaluer la correspondance entre deux distributions (c’est-à-dire que nous utilisons un graphique qq), nous obtenons une très bonne résolution au niveau des queues, mais moins au centre. (Etant donné que les analystes de données sont généralement plus préoccupés par les queues d'une distribution, ce qui aura plus d'effet sur l'inférence, par exemple, les qq-parcelles sont beaucoup plus courantes que les parcelles pp.)
Pour voir ces faits en action, je vais passer en revue la construction d'une parcelle pp et d'une parcelle qq. (Je décris aussi verbalement / plus lentement la construction d'une courbe qq-plot: QQ-plot ne correspond pas à l'histogramme .) Je ne sais pas si vous utilisez R, mais j'espère que cela s'expliquera tout seul:
Malheureusement, ces graphiques ne sont pas très distinctifs, car il existe peu de données et nous comparons une distribution normale normale à une distribution théorique correcte. Il n’ya donc rien de spécial à voir ni au centre ni dans l’arrière de la distribution. Pour mieux démontrer ces différences, je trace une distribution t (à queue grasse) avec 4 degrés de liberté et une distribution bimodale ci-dessous. Les queues épaisses sont beaucoup plus distinctives dans le graphique qq, alors que la bimodalité est plus distinctive dans le graphique pp.
la source
Voici une définition de v8doc.sas.com :
Dans le texte, ils mentionnent également:
Référence :
SAS Institute Inc., SAS OnlineDoc®, version 8, Cary, Caroline du Nord: SAS Institute Inc., 1999
la source