Qual è la distribuzione della differenza di due-t-distribuzioni


19

... e perché ?

Supponendo che , siano variabili casuali indipendenti con rispettivamente media e varianza . Il mio libro di statistiche di base mi dice che la distribuzione di ha le seguenti proprietà:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1X2

  • E(X1X2)=μ1μ2
  • Var(X1X2)=σ12+σ22

Ora diciamo che , sono distribuzioni t con n_1-1 , n_2-2 gradi di libertà. Qual è la distribuzione di X_1-X_2 ?X1X2n11n22X1X2

Questa domanda è stata modificata: la domanda originale era "Quali sono i gradi di libertà della differenza di due distribuzioni t?" . mpiktas ha già sottolineato che questo non ha senso dal momento che non è distribuito in t, indipendentemente da quanto possano essere normali (ovvero df alto).X1X2X1,X2


1
questa è una domanda correlata che potrebbe essere di interesse.
mpiktas,

2
Google il test t Satterthwaite, il test t CABF (approssimazione di Cochran al Behrens-Fisher) e il problema Behrens-Fisher.
whuber

3
2

1
Devi controllare la distribuzione Behrens-Fisher
Wis

Risposte:


15

La somma di due variabili casuali distribuite t indipendenti non è distribuita t. Quindi non si può parlare di gradi di libertà di questa distribuzione, poiché la distribuzione risultante non ha alcun grado di libertà nel senso che ha la distribuzione t.


@mpiktas: domanda stupida. Se la distribuzione t con n-1 df può essere derivata dalla somma di n distribuzioni normali indipendenti (vedi Wikipedia) e data df abbastanza alta in modo che la distribuzione t si avvicini alla distribuzione normale, non deriva da quello che la somma delle distribuzioni t è di nuovo una distribuzione t?
steffen,

@mpiktas: Che dire della statistica test del test t, che sembra derivare dalla differenza di due distribuzioni t?
steffen,

1
@steffen, no. Sarà approssimativamente normale, poiché si aggiungeranno due variabili normali distribuite approssimativamente normali. La distribuzione t con alto df è approssimativamente normale, ma approssimativamente normale non è necessariamente la distribuzione t con alto df.
mpiktas,

1
@steffen, la statistica del test t deriva dalla differenza tra due normali e non due distribuzioni t. Si noti che la definizione di distribuzione t è una frazione della radice normale e quadrata del chi-quadrato.
mpiktas,

1
@steffen, dico spesso ai miei studenti che non ci sono domande stupide, solo persone stupide che non fanno domande. Non sono un insegnante molto popolare che dovrei aggiungere :)
mpiktas,

4

Concordare le risposte sopra, la differenza di due variabili casuali distribuite t indipendenti non sono distribuite. Ma voglio aggiungere alcuni modi per calcolare questo.

  1. Il modo più semplice per calcolare questo è usare un metodo Monte Carlo. In R, ad esempio, campionate casualmente 100.000 numeri dalla prima distribuzione t, quindi campionate casualmente altri 100.000 numeri dalla seconda distribuzione t. Lasciate il primo set di 100.000 numeri meno il secondo set di 100.000 numeri. I 100.000 nuovi numeri ottenuti sono i campioni casuali dalla distribuzione della differenza tra le due distribuzioni. È possibile calcolare la media e la varianza semplicemente usando mean()e var().

    1. Questa si chiama distribuzione Behrens-Fisher. Puoi consultare la pagina Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . L'IC fornito da questa distribuzione è chiamato "intervallo fiduciale", questo non è un elemento della configurazione .

    2. L'integrazione numerica potrebbe funzionare. Questo è continuato come il punto elenco 2. Potresti fare riferimento alla Sezione 2.5.2 in Inferenza bayesiana nell'analisi statistica di Box, George EP, Tiao, George C. Ha i passaggi dettagliati dell'integrazione e come si può approssimare una distribuzione Behrens-Fisher.


1
Mi sembra che la distribuzione Behrens-Fisher si applichi laddove la varianza delle due distribuzioni t non è uguale. Si può dire lo stesso se la varianza delle due distribuzioni è uguale?
Ian Sudbery,

1
Scusa, hai premuto invio due in anticipo? Per continuare ... Ad esempio diciamo che abbiamo due distribuzioni normali di varianza uguale ma sconosciuta, ma con mezzi diversi. Tracciamo due campioni da ciascuna di queste distribuzioni. La differenza di mezzi tra i due campioni della stessa distribuzione seguirà una distribuzione t, ma qual è la distribuzione della differenza delle differenze.
Ian Sudbery,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.