È possibile verificare l'uguaglianza dei parametri medi rispetto all'alternativa secondo cui i parametri medi sono ineguali con un test del rapporto di verosimiglianza (test LR). (Tuttavia, se i parametri medi differiscono e la distribuzione è esponenziale, questo è uno spostamento di scala, non uno spostamento di posizione.)
Per un test a una coda (ma solo asintoticamente nel caso a due code), credo che il test LR risulta equivalente al seguente (per dimostrare che questo è in realtà lo stesso del test LR per il test a una coda nel caso in cui uno avrebbe bisogno di mostrare che la statistica LR era monotona in ):x¯/y¯
Diciamo che parametrizzare il ° di osservazione nel primo esponenziale come avente pdf e il esima osservazione nel secondo campione ad avere pdf (sopra i domini ovvi per le osservazioni e i parametri).
(Per essere chiari, stiamo lavorando nella forma media non nella forma dei tassi qui; ciò non influirà sull'esito dei calcoli.)1 / μ x exp ( - x i / μ x ) j 1 / μ y exp ( - y j / μ y )i1/μxexp(−xi/μx)j1/μyexp(−yj/μy)
Poiché la distribuzione di è un caso speciale di gamma, , la distribuzione della somma di ', è distribuita ; allo stesso modo che per la somma di s, è . Γ ( 1 , μ x ) X S x Γ ( n x , μ x ) Y S y Γ ( n y , μ y )XiΓ(1,μx)XSxΓ(nx,μx)YSyΓ(ny,μy)
A causa della relazione tra le distribuzioni gamma e le distribuzioni chi-quadrato, risulta che è distribuito . Il rapporto di due chi-quadrati sui loro gradi di libertà è F. Quindi il rapporto, .χ 2 2 n x μ y2/μxSxχ22nxμyμxSx/nxSy/ny∼F2nx,2ny
Sotto l'ipotesi nulla dell'uguaglianza dei mezzi, quindi, e sotto l'alternativa bilaterale, i valori potrebbero tendere a essere più piccoli o più grandi di un valore dal null distribuzione, quindi è necessario un test a due code.x¯/y¯∼F2nx,2ny
Simulazione per verificare che non abbiamo commesso un semplice errore nell'algebra:
Qui ho simulato 1000 campioni di dimensioni 30 per e 20 per da una distribuzione esponenziale con la stessa media, e ho calcolato la suddetta statistica rapporto-media.YXY
Di seguito è riportato un istogramma della distribuzione risultante e una curva che mostra la
distribuzione calcolata sotto il valore nullo:F
Esempio, con discussione sul calcolo di valori p a due code :
Per illustrare il calcolo, ecco due piccoli campioni da distribuzioni esponenziali. Il campione X ha 14 osservazioni da una popolazione con media 10, il campione Y ha 17 osservazioni da una popolazione con media 15:
x: 12.173 3.148 33.873 0.160 3.054 11.579 13.491 7.048 48.836
16.478 3.323 3.520 7.113 5.358
y: 7.635 1.508 29.987 13.636 8.709 13.132 12.141 5.280 23.447
18.687 13.055 47.747 0.334 7.745 26.287 34.390 9.596
Le medie del campione sono rispettivamente 12.082 e 16.077. Il rapporto tra le medie è 0,7515
L'area a sinistra è semplice, poiché è nella coda inferiore (calc in R):
> pf(r,28,34)
[1] 0.2210767
Abbiamo bisogno della probabilità per l'altra coda. Se la distribuzione fosse simmetrica all'inverso, sarebbe semplice farlo.
Una convenzione comune con il rapporto di varianze F-test (che è allo stesso modo a due code) è semplicemente quella di raddoppiare il valore p a una coda (effettivamente ciò che sta accadendo come qui ; questo è anche ciò che sembra essere fatto in R, ad esempio ); in questo caso fornisce un valore p di 0,44.
Tuttavia, se lo fai con una regola di rifiuto formale, inserendo un'area di in ciascuna coda, otterrai valori critici come descritto qui . Il valore p è quindi il più grande che porterebbe al rifiuto, che equivale ad aggiungere il valore p ad una coda sopra al valore p ad una coda nell'altra coda per i gradi di libertà scambiati. Nell'esempio sopra che fornisce un valore p di 0,43.αα/2α