L'affaire de discrimination asiatique de Palantir: comment les probabilités ont-elles été calculées?

J'ai lu cet article sur le cas de Palantir où le Département du travail les accuse de discrimination contre les Asiatiques. Quelqu'un sait-il d'où proviennent ces estimations de probabilité?

Je n'obtiens pas 1/741 dans le point (a).

(a) Pour le poste d'ingénieur AQ, parmi un bassin de plus de 730 candidats qualifiés - dont environ 77% étaient asiatiques - Palantir a embauché six candidats non asiatiques et un seul candidat asiatique. L'impact négatif calculé par l'OFCCP dépasse trois écarts types. La probabilité que ce résultat se produise selon le hasard est d'environ un sur 741.

(b) Pour le poste d'ingénieur logiciel, parmi un bassin de plus de 1 160 candidats qualifiés - dont environ 85% étaient asiatiques - Palantir a embauché 14 candidats non asiatiques et seulement 11 candidats asiatiques. L'impact négatif calculé par l'OFCCP dépasse cinq écarts types. La probabilité que ce résultat se produise selon le hasard est d'environ un sur 3,4 millions.

(c) Pour le poste de stagiaire ingénieur AQ, parmi un bassin de plus de 130 candidats qualifiés - dont environ 73% étaient asiatiques - Palantir a embauché 17 candidats non asiatiques et seulement quatre candidats asiatiques. L'impact négatif calculé par l'OFCCP dépasse six écarts types. La probabilité que ce résultat se soit produit par hasard est d'environ un sur un milliard.

probability p-value contingency-tables legal Aksakal presque sûrement binaire
la source

pouvez-vous montrer le calcul que vous avez fait pour obtenir autre chose que 1/741?

Ben Bolker

Mon estimation était unilatérale - si vous la doublez pour en faire un test d'hypothèse bilatéral, vous vous rapprochez assez de ce nombre 1/741.

Gregor - réintègre Monica le

Je suis d'accord que doubler n'a aucun sens dans ce cas, j'essayais juste de deviner ce qui aurait pu être fait. La question n'est pas de savoir quelle est la bonne réponse, mais comment en sont-ils arrivés à cette estimation .

Gregor - réintègre Monica le

Ce serait formidable si quelqu'un convertissait la capture d'écran PDF en une citation de texte ...

amibe dit Reinstate Monica

J'ai réussi à OCR votre capture d'écran en utilisant finereaderonline.com .

amibe dit Reinstate Monica

Réponses:

Je vais procéder à une rétro-ingénierie à partir de mon expérience des cas de discrimination. Je peux certainement établir d'où viennent les valeurs de «un sur 741», etc. Cependant, tellement d'informations ont été perdues dans la traduction que le reste de ma reconstruction repose sur le fait d'avoir vu comment les gens font des statistiques dans les salles d'audience. Je ne peux que deviner certains détails.

Depuis que les lois anti-discrimination ont été adoptées dans les années 1960 (titre VI), les tribunaux américains ont appris à examiner les valeurs p et à les comparer à des seuils de et . Ils ont également appris à examiner les effets normalisés, généralement appelés «écarts-types», et à les comparer à un seuil de «deux à trois écarts-types». Afin d'établir une preuve prima facie pour une action en discrimination, les plaignants tentent généralement un calcul statistique montrant un «impact disparate» qui dépasse ces seuils. Si un tel calcul ne peut pas être pris en charge, le cas ne peut généralement pas avancer. $0.05$ $0.01$

Les experts statistiques des plaignants tentent souvent d'exprimer leurs résultats en ces termes familiers. Certains des experts effectuent un test statistique dans lequel l'hypothèse nulle n'exprime «aucun impact négatif», en supposant que les décisions en matière d'emploi étaient purement aléatoires et non régies par d'autres caractéristiques des employés. (Que ce soit une alternative unilatérale ou bilatérale peut dépendre de l'expert et des circonstances.) Ils convertissent ensuite la valeur de p de ce test en un certain nombre d '"écarts-types" en le référant à la distribution normale standard- - même lorsque la norme normale n'est pas pertinente pour le test d'origine. De cette manière détournée, ils espèrent communiquer clairement leurs conclusions au juge.

Le test préféré pour les données qui peuvent être résumées dans des tableaux de contingence est le test exact de Fisher. L'occurrence de "Exact" dans son nom est particulièrement agréable aux plaignants, car elle implique une détermination statistique qui a été faite sans erreur (quelle qu'elle soit!).

Voici donc ma (reconstruction spéculative) des calculs du ministère du Travail.

$\chi^2$
Ils ont converti sa valeur de p en un score Z normal ("nombre d'écarts types").
Ils ont arrondi le score Z à l'entier le plus proche: "dépasse trois écarts-types", "dépasse cinq écarts-types" et "dépasse six écarts-types". (Parce que certains de ces scores Z ont arrondi à des écarts-types plus élevés , je ne peux pas justifier les «dépassements»; tout ce que je peux faire, c'est le citer.)
Dans la plainte, ces scores Z intégraux ont été reconvertis en valeurs p! Encore une fois, la distribution normale standard a été utilisée.
Ces valeurs de p sont décrites (sans doute de manière trompeuse) comme «la probabilité que ce résultat se produise selon le hasard».

$1/1280$ $1/565000$ $1/58000000$ $730$ $1160$ $130$ $730$ $1160$ $130$ $-3.16$ $-4.64$ $-5.52$ $1/741$ $1/3500000$ $1/1000000000$

Voici un Rcode utilisé pour effectuer ces calculs.

f <- function(total, percent.asian, hired.asian, hired.non.asian) {
  asian <- round(percent.asian/100 * total)
  non.asian <- total-asian
  x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
              nrow = 2,
              dimnames=list(Race=c("Asian", "non-Asian"),
                            Status=c("Not hired", "Hired")))
  s <- fisher.test(x)
  s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))

whuber
la source

Wow, je ne pouvais pas deviner que cela pouvait être fait. C'est effrayant.

Aksakal presque sûrement binaire

(+1) CSI: Statistiques.

Firebug

Comment calculer correctement les pvals en utilisant la distribution hypergéométrique:

$k$ $n$ $K$ $N$

Pour un test unilatéral, dans MATLAB, vous pouvez appeler pval = hygecdf(k, N, K, n);ou, dans ce cas, pval = hygecdf(1, 730, 562, 7)environ .0007839.

L'écart moyen et standard sont donnés par:

μ = n \frac{K}{N} s = \sqrt{n \frac{K}{N} \frac{N - K}{N} \frac{N - n}{N - 1}}

$\mu = n \frac{K}{N} \quad \quad \quad s = \sqrt{n \frac{K}{N} \frac{N - K}{N} \frac{N - n}{N-1}}$

$\chi^2$

À la recherche de formules que l'OFCCP pourrait utiliser, ce site que j'ai vu peut peut-être être utile: http://www.hr-software.net/EmploymentStatistics/DisparateImpact.htm

Résumé de certains calculs:

\begin{array}{rrrr} Number and method & Part A & Part B & Part C \\ PVal from hypergeometric CDF & 7.839e-04 & 1.77e-06 & 1.72e-08 \\ χ^{2} stat & 15.68 & 33.68 & 37.16 \\ χ^{2} pval & 7.49e-05 & 6.47e-09 & 1.09e-09 \\ Pval from above document & .00135 & 2.94e-07 & 1.00e-09 \end{array}

$\begin{array}{rrrr} \text{Number and method} & \text{Part A} & \text{Part B} & \text{Part C} \\ \text{PVal from hypergeometric CDF} & \text{7.839e-04} & \text{1.77e-06} & \text{1.72e-08}\\ \chi^2 \text{ stat} & 15.68 & 33.68 & 37.16\\ \chi^2 \text{ pval} & \text{7.49e-05} & \text{6.47e-09} & \text{1.09e-09} \\ \text{Pval from above document} & .00135 & \text{2.94e-07} & \text{1.00e-09} \end{array}$

$\chi^2$ $\sum \frac{(\text{expected} - \text{actual})^2}{\text{expected}}$

Matthew Gunn
la source

J'ai obtenu le même résultat mais différemment. Ce n'est pas près du 1/741

Aksakal presque sûrement binaire