Une question plus profonde est de savoir si les quantiles, etc. sont des intervalles ou des points.
Henry
8
Les quantiles sont définis comme des points. Il y a souvent une ambiguïté entre les intervalles et les points pour les quartiles, etc. il ne mord pas très fort dans la pratique, car le contexte précise généralement le but recherché. Je préfère le premier trimestre (plutôt que le quartile), pour les 25% les plus bas, etc. Bien que ce soit trop espérer que la distinction sera évidente de manière universelle sans explication.
Nick Cox
Ma réponse à stats.stackexchange.com/questions/235330/… contient une liste plus complète de termes * ile, y compris les dates de première utilisation. Naturellement, les ajouts et les observations précédentes sont les bienvenus.
Au cas où quelqu'un d'autre serait confus en regardant ceci: cela ne signifie pas qu'un quantile varie entre 0 et 1, et un centile entre 0 et 100, mais que ce sont les domaines des fonctions quantile (x) et centile (x), qui renvoient une valeur observée dont la plage dépend entièrement de votre problème spécifique (par exemple, si vous mesurez les précipitations, elles sont probablement comprises entre 0 et 10).
Joseph Garvin
36
Les centiles vont de à .0100
Les quartiles vont de à (ou de à ).1404
Les quantiles peuvent aller de n'importe quoi à n'importe quoi.
Les centiles et les quartiles sont des exemples de quantiles.
Si vous considérez le maximum comme le 4ème quartile, alors je suggérerais que le décompte commence par rapport au minimum, le 0ème quartile.
Nick Cox
1
Les centiles peuvent-ils aussi être mis à l'échelle pour être compris entre 0 et 1? Ex: est-il logique de dire percentile(array, 0.5)(la médiane)?
Cam.Davidson.Pilon
2
Le "pourcentage" de "centile" vient de "cent" pour 100. Si vous avez une échelle entre 0 et 1, vous avez une proportion. Bien sûr, ils sont équivalents.
Peter Flom - Réintégrer Monica
Pouvez-vous préciser "les quantiles peuvent aller de n'importe quoi à n'importe quoi"? Je constate que dans les graphiques QQ, les quantiles ne sont pas dans la plage [0, 1], comme le dit la réponse de @ stochazesthai.
arun
Vous pouvez faire 1000 tuiles ou 10 000 tuiles ou ce que vous aimez.
Peter Flom - Réintégrer Monica
14
Afin de définir ces termes de manière rigoureuse, il est utile de commencer par définir la fonction de quantile,
également appelée fonction de distribution cumulative inverse . Rappelons que pour une variable aléatoire , la fonction de distribution cumulative est définie par l'équation
La fonction quantile est définie par l'équation
XFX
FX(x):=Pr(X≤x).
Q(p)=inf{x∈R:p≤F(x)}.
Maintenant que nous avons éliminé ces définitions, nous pouvons définir les termes:
percentile : mesure utilisée dans les statistiques indiquant la valeur en dessous de laquelle un pourcentage donné d'observations dans un groupe d'observations se situe.
Exemple: le 20ème centile de
est la valeurXQX(0.20)
quantile : valeurs prises à des intervalles réguliers de la fonction quantile d'une variable aléatoire. Par exemple, pour un certain nombre entier , les quartiles sont définis comme les valeurs, c.-à-d. pour .k≥2kQX(j/k)j=1,2,…,k−1
Exemple: les 5 quantiles de sont les valeurs
XQX(0.2),QX(0.4),QX(0.6),QX(0.8)
quartile : un cas particulier de quantile, en particulier les 4-quantiles. Les quartiles de sont les valeurs
XQX(0.25),QX(0.5),QX(0.75)
Il peut être utile que vous trouviez un exemple de ce que ces définitions signifient en définissant , c’est-à-dire que est uniformément distribué de 0 à 100.X∼U[0,100]X
Utile, mais une très légère maladresse au milieu. La définition n'implique pas que tout ensemble discret de quantiles sur lequel vous vous concentrez doit être sélectionné avec une probabilité régulière. Par exemple, regarder quelque chose comme 1, 5, 10, 25 (25) 75, 90, 95, 99% des points est une partie courante du résumé de la variable.
Nick Cox
@ NickCox Ma définition de quantile était d'utiliser la définition de Wikipedia en.wikipedia.org/wiki/Quantile "Les quantiles sont des valeurs prises à intervalles réguliers à partir de l'inverse de la fonction de distribution cumulative (CDF) d'une variable aléatoire."
J'aime Code
1
Merci pour la référence, mais je soutiens que l'utilisation d'intervalles réguliers ne fait partie d'aucune définition. Les quantiles ne cesseront pas d’être quantiles si vous choisissez (disons) 50, 75, 90, 95, 99% points.
Nick Cox
@ NickCox Votre définition est également logique. Je ne suis pas sûr de savoir pourquoi Wikipedia exigeait des "intervalles réguliers" dans leur définition.
J'aime Code
4
J'utilise Wikipedia tous les jours avec tendresse et me méfie énormément de ce genre de chose.
The only 2-quantile is called the median
The 3-quantiles are called tertiles or terciles → T
The 4-quantiles are called quartiles → Q
The 5-quantiles are called quintiles → QU
The 6-quantiles are called sextiles → S
The 8-quantiles are called octiles → O (as added by @NickCox - now on wiki page also)
The 10-quantiles are called deciles → D
The 12-quantiles are called duodeciles → Dd
The 20-quantiles are called vigintiles → V
The 100-quantiles are called percentiles → P
The 1000-quantiles are called permilles → Pr
La différence entre quantile, quartileet percentiledevient évidente.
J'ai vu aussi des références à octiles (8). Cette liste est le meilleur argument que l'on puisse imaginer pour les quantiles à terme unique .
Nick Cox
Je l'ai ajouté à ma réponse. Vous pouvez également l'ajouter à la page wikipedia.
rnso
3
Merci pour l'édition. Je ne pense pas que ces symboles ressemblent à des symboles standard ou même bien choisis; le résultat collectif est juste une soupe à l'alphabet même s'il est peu probable que beaucoup soient utilisés ensemble. En particulier, utiliser ou pour tout sauf une probabilité est une idée terrible. Qui veut se rappeler de quel côté sont et ? PPrQQu
Nick Cox
1
Je ne participe pas à l'écriture de Wikipedia. Tous ceux qui en ont l'esprit sont invités à ajouter "octile".
Nick Cox
-1
Centile: Le pourcentage de la population qui se situe en dessous de cette valeur
Quantile: Les points de coupure divisant la plage de distribution de probabilité en intervalles continus à probabilité égale.
Il existe q-1 de q quantiles, un de chaque k satisfaisant 0 <k <q
Quartile: le quartile est un cas particulier de quantile, les quartiles coupent le jeu de données en quatre parties égales, c.-à-d. Q = 4 pour les quantiles. Nous avons donc le premier quartile Q1 , le deuxième quartile Q2 (médiane) et le troisième quartile Q3.
Vos définitions sont en conflit les unes avec les autres et avec les standards, tels que en.wikipedia.org/wiki/Percentile , qui font du centile une valeur particulière de la population plutôt qu'un "pourcentage de la population".
whuber
Le centile est fondamentalement le pourcentage de la population situé en dessous de cette valeur. Par exemple, 200 points à l'examen CAT est égal à 90 centiles, ce qui signifie que 90% des candidats ont une note inférieure à 200
Réponses:
0 quartile = 0 quantile = 0 centile
1 quartile = 0,25 quantile = 25 centile
2 quartile = 0,5 quantile = 50 centile (médiane)
3 quartile = 0,75 quantile = 75 centile
4 quartile = 1 quantile = 100 centile
la source
Les centiles vont de à .0 100
Les quartiles vont de à (ou de à ).1 4 0 4
Les quantiles peuvent aller de n'importe quoi à n'importe quoi.
Les centiles et les quartiles sont des exemples de quantiles.
la source
percentile(array, 0.5)
(la médiane)?Afin de définir ces termes de manière rigoureuse, il est utile de commencer par définir la fonction de quantile, également appelée fonction de distribution cumulative inverse . Rappelons que pour une variable aléatoire , la fonction de distribution cumulative est définie par l'équation La fonction quantile est définie par l'équationX FX
Maintenant que nous avons éliminé ces définitions, nous pouvons définir les termes:
percentile : mesure utilisée dans les statistiques indiquant la valeur en dessous de laquelle un pourcentage donné d'observations dans un groupe d'observations se situe.
Exemple: le 20ème centile de est la valeurX QX(0.20)
quantile : valeurs prises à des intervalles réguliers de la fonction quantile d'une variable aléatoire. Par exemple, pour un certain nombre entier , les quartiles sont définis comme les valeurs, c.-à-d. pour .k≥2 k QX(j/k) j=1,2,…,k−1
Exemple: les 5 quantiles de sont les valeursX QX(0.2),QX(0.4),QX(0.6),QX(0.8)
Il peut être utile que vous trouviez un exemple de ce que ces définitions signifient en définissant , c’est-à-dire que est uniformément distribué de 0 à 100.X∼U[0,100] X
Références de Wikipedia:
la source
De la page wiki: https://en.wikipedia.org/wiki/Quantile
La différence entre
quantile
,quartile
etpercentile
devient évidente.la source
Centile: Le pourcentage de la population qui se situe en dessous de cette valeur
Quantile: Les points de coupure divisant la plage de distribution de probabilité en intervalles continus à probabilité égale.
Il existe q-1 de q quantiles, un de chaque k satisfaisant 0 <k <q
Quartile: le quartile est un cas particulier de quantile, les quartiles coupent le jeu de données en quatre parties égales, c.-à-d. Q = 4 pour les quantiles. Nous avons donc le premier quartile Q1 , le deuxième quartile Q2 (médiane) et le troisième quartile Q3.
la source