Il caso di discriminazione asiatica di Palantir: come sono state calcolate le probabilità?


14

Ho letto questo articolo sul caso di Palantir in cui il Dipartimento del Lavoro li sta accusando di discriminazione nei confronti degli asiatici. Qualcuno sa da dove hanno preso queste stime di probabilità?

Non ricevo 1/741 nell'articolo (a).

(a) Per la posizione di Ingegnere addetto al controllo qualità, da un pool di oltre 730 candidati qualificati, di cui circa il 77% erano asiatici, Palantir ha assunto sei candidati non asiatici e un solo candidato asiatico. L'impatto negativo calcolato dall'UFCCP supera tre deviazioni standard. La probabilità che questo risultato si sia verificato per caso è approssimativamente una su 741.

(b) Per la posizione di Software Engineer, da un pool di oltre 1.160 candidati qualificati - circa l'85% dei quali erano asiatici - Palantir ha assunto 14 candidati non asiatici e solo 11 candidati asiatici. L'impatto negativo calcolato dall'UFCCP supera cinque deviazioni standard. La probabilità che questo risultato si sia verificato per caso è di circa uno su 3,4 milioni.

(c) Per la posizione di Tirocinante per il QA, da un pool di oltre 130 candidati qualificati, di cui circa il 73% asiatici, Palantir ha assunto 17 candidati non asiatici e solo quattro candidati asiatici. L'impatto negativo calcolato dall'UFCCP supera le sei deviazioni standard. La probabilità che questo risultato si sia verificato per caso è di circa uno su un miliardo.


puoi mostrare il calcolo che hai fatto per ottenere qualcosa di diverso da 1/741?
Ben Bolker,

1
La mia stima era unilaterale: se lo raddoppi per renderlo come un test di ipotesi su due lati, ti avvicini abbastanza a quel numero 1/741.
Gregor - ripristina Monica il

3
Concordo sul fatto che il raddoppio non ha alcun senso in questo caso, stavo solo cercando di indovinare cosa avrebbe potuto essere fatto. La domanda non è quale sia la risposta giusta, ma come sono arrivati ​​a questa stima .
Gregor - ripristina Monica il

1
Sarebbe bello se qualcuno dovesse convertire la schermata PDF in una citazione del testo ...
ameba dice Ripristinare Monica

1
Sono riuscito a OCR il tuo screenshot usando finereaderonline.com .
ameba dice Reinstate Monica il

Risposte:


20

Ho intenzione di decodificare questo per esperienza con i casi di discriminazione. Posso sicuramente stabilire da dove provengono i valori di "uno su 741" , ecc . Tuttavia, così tante informazioni sono state perse nella traduzione che il resto della mia ricostruzione si basa sul fatto di aver visto come le persone fanno statistiche in ambito giudiziario. Posso solo indovinare alcuni dei dettagli.


Da quando sono state approvate le leggi antidiscriminazione negli anni '60 (titolo VI), i tribunali degli Stati Uniti hanno imparato a esaminare i valori di p e confrontarli con le soglie di e 0,01 . Hanno anche imparato a esaminare gli effetti standardizzati, in genere denominati "deviazioni standard" e confrontarli con una soglia di "2-3 deviazioni standard". Al fine di stabilire un caso prima facie per una causa di discriminazione, i querelanti in genere tentano un calcolo statistico che mostri un "impatto disparato" che superi queste soglie. Se tale calcolo non può essere supportato, il caso di solito non può avanzare.0.050.01

Gli esperti statistici per i querelanti spesso cercano di esprimere i loro risultati in questi termini familiari. Alcuni esperti conducono un test statistico in cui l'ipotesi nulla esprime "nessun impatto negativo", supponendo che le decisioni di assunzione fossero puramente casuali e non governate da qualsiasi altra caratteristica dei dipendenti. (Che si tratti di un'alternativa a una coda o a due code può dipendere dall'esperto e dalle circostanze.) Quindi convertono il valore p di questo test in un numero di "deviazioni standard" facendo riferimento alla distribuzione normale standard- - anche quando lo standard normale è irrilevante per il test originale. In questo modo sperano di comunicare chiaramente le proprie conclusioni al giudice.

Il test preferito per i dati che possono essere riassunti nelle tabelle di contingenza è il test esatto di Fisher. La presenza di "Exact" nel suo nome è particolarmente piacevole per i querelanti, perché connota una determinazione statistica che è stata fatta senza errori (qualunque cosa possa essere!).

Ecco quindi la mia (ricostruzione speculativa) dei calcoli del Dipartimento del Lavoro.

  1. Hanno eseguito Fisher's Exact Test, o qualcosa del genere (come un test con un valore p determinato tramite randomizzazione). Questo test presuppone una distribuzione ipergeometrica come descritto nella risposta di Matthew Gunn. (Per il piccolo numero di persone coinvolte in questa lamentela, la distribuzione ipergeometrica non è ben approssimata da una distribuzione normale.)χ2

  2. Hanno convertito il suo valore p in un normale punteggio Z ("numero di deviazioni standard").

  3. Hanno arrotondato il punteggio Z al numero intero più vicino: "supera tre deviazioni standard", "supera cinque deviazioni standard" e "supera sei deviazioni standard". (Poiché alcuni di questi Z-score arrotondato il fino a deviazioni più standard, non riesco a giustificare la "superiore"; tutto quello che posso fare è di citarlo.)

  4. Nel reclamo questi punteggi Z integrali sono stati riconvertiti in valori p! Anche in questo caso è stata utilizzata la distribuzione normale standard.

  5. Questi valori p sono descritti (probabilmente in modo fuorviante) come "la probabilità che questo risultato si sia verificato per caso".

1/12801/5650001/58000000730116013073011601303.164.645.521/7411/35000001/1000000000


Ecco un Rcodice utilizzato per eseguire questi calcoli.

f <- function(total, percent.asian, hired.asian, hired.non.asian) {
  asian <- round(percent.asian/100 * total)
  non.asian <- total-asian
  x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
              nrow = 2,
              dimnames=list(Race=c("Asian", "non-Asian"),
                            Status=c("Not hired", "Hired")))
  s <- fisher.test(x)
  s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))

6
Wow, non potevo immaginare che si potesse fare. Questo è spaventoso.
Aksakal,

7
(+1) CSI: statistiche.
Firebug,

5

Come calcolare correttamente i pvals usando la distribuzione ipergeometrica:

knKN

Per un test unilaterale, in MATLAB, puoi chiamare pval = hygecdf(k, N, K, n);o in questo caso pval = hygecdf(1, 730, 562, 7)che è circa .0007839.

La deviazione media e standard sono date da:

μ=nKNs=nKNNKNNnN1

χ2

Alla ricerca di formule che OFCCP potrebbe utilizzare, questo sito che ho visto potrebbe forse essere utile: http://www.hr-software.net/EmploymentStatistics/DisparateImpact.htm

Riepilogo di alcuni calcoli:

Number and methodPart APart BPart CPVal from hypergeometric CDF7.839e-041.77e-061.72e-08χ2 stat15.6833.6837.16χ2 pval7.49e-056.47e-091.09e-09Pval from above document.001352.94e-071.00e-09

χ2(expectedactual)2expected


1
Ho ottenuto lo stesso risultato ma in modo diverso. Non è vicino al 1/741
Aksakal,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.