Con l'ipotesi nulla che le distribuzioni siano uguali e che entrambi i campioni siano ottenuti in modo casuale e indipendente dalla distribuzione comune, possiamo calcolare le dimensioni di tutti i test (deterministici) che possono essere effettuati confrontando un valore di lettera con un altro . Alcuni di questi test sembrano avere un potere ragionevole per rilevare le differenze nelle distribuzioni.5×5
Analisi
La definizione originale del riepilogo a lettere di qualsiasi lotto di numeri ordinato è la seguente [Tukey EDA 1977]:5x1≤x2≤⋯≤xn
Per qualsiasi numero in definisci{ ( 1 + 2 ) / 2 , ( 2 + 3 ) / 2 , … , ( n - 1 + n ) / 2 } x m = ( x i + x i + 1 ) / 2.m=(i+(i+1))/2{(1+2)/2,(2+3)/2,…,(n−1+n)/2}xm=(xi+xi+1)/2.
Let .i¯=n+1−i
Sia eh = ( ⌊ m ⌋ + 1 ) / 2.m=(n+1)/2h=(⌊m⌋+1)/2.
Il riepilogo a lettere è l'insieme I suoi elementi sono noti come minimo, cerniera inferiore, mediana, cerniera superiore e massima, rispettivamente.{ X - = x 1 , H - = x h , M = x m , H + = x ˉ h , X + = x n } .5{X−=x1,H−=xh,M=xm,H+=xh¯,X+=xn}.
Ad esempio, nel batch di dati possiamo calcolare che , e , da cui(−3,1,1,2,3,5,5,5,7,13,21)n=12m=13/2h=7/2
X−H−MH+X+=−3,=x7/2=(x3+x4)/2=(1+2)/2=3/2,=x13/2=(x6+x7)/2=(5+5)/2=5,=x7/2¯¯¯¯¯¯¯¯=x19/2=(x9+x10)/2=(5+7)/2=6,=x12=21.
Le cerniere sono vicine (ma di solito non sono esattamente le stesse) dei quartili. Se si utilizzano quartili, nota che in generale essi saranno ponderati medie aritmetiche di due delle statistiche d'ordine e quindi si trovano entro uno degli intervalli dove può essere determinato dal e l'algoritmo utilizzato per calcolare i quartili. In generale, quando è in un intervallo scriverò vagamente per fare riferimento ad una media ponderata di e .i n q [ i , i + 1 ] x q x i x i + 1[xio, xi + 1]ionq[i,i+1]xqxixi+1
Con due lotti di dati e ci sono due riepiloghi separati di cinque lettere. Possiamo testare l'ipotesi nulla che entrambi siano campioni casuali di una distribuzione comune confrontando una delle lettere con una delle lettere . Ad esempio, potremmo confrontare la cerniera superiore di con la cerniera inferiore di per vedere se è significativamente inferiore a . Questo porta a una domanda precisa: come calcolare questa possibilità,( y j , j = 1 , … , m ) , F x x q y y r x y x y(xi,i=1,…,n)(yj,j=1,…,m),Fxxqyyrxyxy
PrF(xq<yr).
Per frazionale e questo non è possibile senza sapere . Tuttavia, poiché e allora a fortioriqrFxq≤x⌈q⌉y⌊r⌋≤yr,
PrF(xq<yr)≤PrF(x⌈q⌉<y⌊r⌋).
Possiamo così ottenere limiti superiori universali (indipendenti da ) sulle probabilità desiderate calcolando la probabilità della mano destra, che confronta le statistiche dei singoli ordini. La domanda generale di fronte a noi èF
Qual è la possibilità che il più alto di valori sia inferiore al più alto di valori estratti da una distribuzione comune?qthnrthm
Anche questo non ha una risposta universale a meno che non escludiamo la possibilità che la probabilità sia troppo fortemente concentrata su valori individuali: in altre parole, dobbiamo supporre che i legami non siano possibili. Ciò significa che deve essere una distribuzione continua. Sebbene questo sia un presupposto, è debole e non parametrico.F
Soluzione
La distribuzione non ha alcun ruolo nel calcolo, poiché ri-esprimendo tutti i valori mediante la trasformazione di probabilità , otteniamo nuovi lottiFF
X(F)=F(x1)≤F(x2)≤⋯≤F(xn)
e
Y(F)=F(y1)≤F(y2)≤⋯≤F(ym).
Inoltre, questa è monotona e in aumento: preserva l'ordine e in tal modo preserva l'evento Poiché è continuo, questi nuovi lotti vengono estratti da una distribuzione Uniforme . Sotto questa distribuzione - e eliminando la " " ormai superflua dalla notazione - troviamo facilmente che ha una distribuzione Beta = Beta :xq<yr.F[0,1]Fxq(q,n+1−q)(q,q¯)
Pr(xq≤x)=n!(n−q)!(q−1)!∫x0tq−1(1−t)n−qdt.
Allo stesso modo la distribuzione di è Beta . Eseguendo la doppia integrazione sulla regione possiamo ottenere la probabilità desiderata,yr(r,m+1−r)xq<yr
Pr(xq<yr)=Γ(m+1)Γ(n+1)Γ(q+r)3F~2(q,q−n,q+r; q+1,m+q+1; 1)Γ(r)Γ(n−q+1)
Poiché tutti i valori sono integrali, tutti i valori sono in realtà solo fattoriali: per integrale
La funzione poco nota è una funzione ipergeometrica regolarizzata . In questo caso può essere calcolato come una somma alternata piuttosto semplice di lunghezza , normalizzata da alcuni fattoriali:n,m,q,rΓΓ(k)=(k−1)!=(k−1)(k−2)⋯(2)(1)k≥0.3F~2n−q+1
Γ(q+1)Γ(m+q+1) 3F~2(q,q−n,q+r; q+1,m+q+1; 1)=∑i=0n−q(−1)i(n−qi)q(q+r)⋯(q+r+i−1)(q+i)(1+m+q)(2+m+q)⋯(i+m+q)=1−(n−q1)q(q+r)(1+q)(1+m+q)+(n−q2)q(q+r)(1+q+r)(2+q)(1+m+q)(2+m+q)−⋯.
Ciò ha ridotto il calcolo della probabilità a niente di più complicato di addizione, sottrazione, moltiplicazione e divisione. Lo sforzo computazionale viene ridimensionato come Sfruttando la simmetriaO((n−q)2).
Pr(xq<yr)=1−Pr(yr<xq)
il nuovo calcolo viene ridimensionato come permettendoci di scegliere la più semplice delle due somme, se lo desideriamo. Ciò sarà raramente necessario, tuttavia, poiché i riepiloghi a lettere tendono ad essere utilizzati solo per piccoli lotti, raramente superiori aO((m−r)2),5n,m≈300.
Applicazione
Supponiamo che i due lotti abbiano dimensioni e . Statistiche d'ordine rilevanti per ed sono e rispettivamente. Ecco una tabella delle probabilità che con indicizzi le righe e indicizzi le colonne:n=8m=12xy1,3,5,7,81,3,6,9,12,xq<yrqr
q\r 1 3 6 9 12
1 0.4 0.807 0.9762 0.9987 1.
3 0.0491 0.2962 0.7404 0.9601 0.9993
5 0.0036 0.0521 0.325 0.7492 0.9856
7 0.0001 0.0032 0.0542 0.3065 0.8526
8 0. 0.0004 0.0102 0.1022 0.6
Una simulazione di 10.000 coppie di campioni iid da una distribuzione normale standard ha dato risultati vicini a questi.
Per costruire un test unilaterale con dimensione come per determinare se il batch è significativamente inferiore al batch , cercare i valori in questa tabella vicino o appena sotto . Le buone scelte sono a dove la possibilità è a con una possibilità di e a con una possibilità di Quale usare dipende dai tuoi pensieri sull'ipotesi alternativa. Ad esempio, il test confronta la cerniera inferiore di con il valore più piccolo diα,α=5%,xyα(q,r)=(3,1),0.0491,(5,3)0.0521(7,6)0.0542.(3,1)xy trova una differenza significativa quando quella cerniera inferiore è quella più piccola. Questo test è sensibile ad un valore estremo di ; se c'è qualche preoccupazione sui dati periferici, questo potrebbe essere un test rischioso da scegliere. D'altra parte il test confronta la cerniera superiore di con la mediana di . Questo è molto robusto per i valori esterni nel batch e moderatamente robusto per i valori anomali in . Tuttavia, confronta i valori medi di con i valori medi di . Anche se questo è probabilmente un buon confronto da fare, non rileverà differenze nelle distribuzioni che si verificano solo in entrambe le code.y(7,6)xyyxxy
Essere in grado di calcolare questi valori critici aiuta analiticamente a selezionare un test. Una volta identificati uno (o più) test, la loro capacità di rilevare i cambiamenti è probabilmente meglio valutata attraverso la simulazione. Il potere dipenderà fortemente dalla differenza delle distribuzioni. Per capire se questi test hanno qualche potere, ho condotto il test con disegnato da una distribuzione normale : cioè la sua mediana è stata spostata di una deviazione standard. In una simulazione il test è stato significativo il delle volte: questa è una potenza apprezzabile per set di dati così piccoli.(5,3)yj(1,1)54.4%
Si può dire molto di più, ma tutto è roba di routine sulla conduzione di test su due lati, su come valutare le dimensioni degli effetti e così via. Il punto principale è stato dimostrato: dati i riepiloghi (e le dimensioni) di lettere di due lotti di dati, è possibile costruire test non parametrici ragionevolmente potenti per rilevare differenze nelle popolazioni sottostanti5 e in molti casi potremmo persino avere diversi scelte di test tra cui scegliere. La teoria sviluppata qui ha un'applicazione più ampia per confrontare due popolazioni per mezzo di statistiche dell'ordine opportunamente selezionate dai loro campioni (non solo quelli che si avvicinano ai riassunti delle lettere).
Questi risultati hanno altre utili applicazioni. Ad esempio, un diagramma a scatole è una rappresentazione grafica di un riepilogo di lettere. Pertanto, insieme alla conoscenza delle dimensioni del campione mostrate da un diagramma a scatole, abbiamo a disposizione una serie di semplici test (basati sul confronto tra parti di una scatola e baffi su un'altra) per valutare il significato delle differenze visivamente evidenti in quelle trame.5