Come verificare se


9

Supponiamo che io abbia tre gruppi indipendenti, rispettivamente con media .μ1, μ2, μ3

Come posso verificare se o meno usando campioni da ciascun gruppo?μ1<μ2<μ3n1, n2, n3

Vorrei conoscere una metodologia generale, non un calcolo dettagliato. Non sono riuscito a capire come impostare la mia ipotesi H0 e H1 .


1
Questo è un caso di inferenza statistica limitata dall'ordine . Ci sono libri sull'argomento .
kjetil b halvorsen,

1
C'è anche il vecchio libro di Barlow, Bartholemew, Bremner e Brunk Inference statistica sotto le restrizioni dell'ordine (1973) (anche se da allora ci sono stati alcuni sviluppi); per quanto riguarda i test non parametrici, c'è il test Jonckheere-Terpstra (ad es. vedi Conover) e uno dei test Match (prova il libro di Neave e Worthington). In genere si scrive un valore nullo per l'uguaglianza e un'alternativa ordinata.
Glen_b -Restate Monica


Qui si dovrebbe dire, non che si hanno campioni dal gruppo ma che si ha un campione di dimensioni dal gruppo i , n i i .nioio,nioio.
Michael Hardy,

Risposte:


8

Nelle statistiche non è possibile verificare se "X è vera o no". Puoi solo provare a provare che un'ipotesi nulla è falsa.

Supponiamo che la tua ipotesi nulla sia Supponiamo anche che tu abbia un modo di stimare il vettore . Per mantenere le cose, supponiamo che tu abbia uno stimatore dove è matrice covariata. Possiamo riscrivere l'ipotesi nulla come dove Ciò dimostra che la tua ipotesi nulla può essere espressa come una restrizione di disuguaglianza sul vettore . Uno stimatore naturale di è dato da

H01:μ1<μ2<μ3.
μ=(μ1,μ2,μ3)'
X~N(μ,Σ),
Σ3×3
UNμ<0,
UN=[1-1001-1].
UNμUNμ
UNX~N(UNμ,UNΣUN').
È ora possibile utilizzare il framework per testare il vincolo di disuguaglianza su vettori normali indicati in:

Kudo, Akio (1963). "Un analogo multivariato del test unilaterale". In: Biometrika 50.3 / 4, pagg. 403–418.

Questo test funzionerà anche se il presupposto della normalità vale solo approssimativamente ("asintoticamente"). Ad esempio, funzionerà se è possibile trarre mezzi di campionamento dai gruppi. Se disegni campioni di dimensioni e se riesci a disegnare indipendentemente dai gruppi, allora è una matrice diagonale con diagonale dove è la varianza nel gruppo . In un'applicazione, è possibile utilizzare la varianza del campione anziché la varianza della popolazione sconosciuta senza modificare le proprietà del test.n1,n2,n3Σ

(σ12/n1,σ22/n2,σ32/n3)',
σK2K=1,2,3

Se d'altra parte la tua ipotesi alternativa è allora la tua ipotesi nulla diventa Questo non è molto operativo. Ricorda che la nostra nuova ipotesi alternativa può essere scritta come modo che Non so se esiste un test specializzato per questo, ma puoi sicuramente provare qualche strategia basata su test successivi. Ricorda che provi a trovare prove contro il nulla. Quindi puoi prima provare e poi Se rifiuti entrambe le volte allora hai trovato prove che

H12:μ1<μ2<μ3
H02:NON H1.
H1:UNμ<0
H02:esiste un K=1,2 tale che (UNμ)K0.
H0,12:(UNμ)10.
H0,22:(UNμ)20.
H0H 0 H 0 Σè falso e rifiuti . Se non lo fai, allora non rifiuti . Dato che stai testando più volte devi regolare il livello nominale del sottotest. Puoi usare una correzione Bonferroni o capire una correzione esatta (dato che conosci ).H0H0Σ

Un altro modo di costruire un test per è notare che Ciò implica l'utilizzo di come statistica di test. Il test avrà una distribuzione non standard sotto il valore null, ma il valore critico appropriato dovrebbe essere comunque abbastanza facile da calcolare.H02

H02:maxK=1,2(UNμ)K0.
maxUNX


Abbastanza giusto, ho modificato la mia risposta.
Andreas Dzemski,

Buona risposta (+1). Solo per migliorarlo un po 'di più, posso raccomandare di sostituire con modo che la notazione rifletta l'intenzione che questo oggetto sia uno stimatore per . u uXμ^μ
Ben - Ripristina Monica il

1

La risposta fornita da @ andreas-dzemski è corretta solo se sappiamo che i dati sono normalmente distribuiti.

Se non conosciamo la distribuzione, credo che sarebbe meglio eseguire un test non parametrico. In questo caso, il più semplice sembra eseguire un test di permutazione. Questo è un libro sull'argomento e questa è una bella spiegazione online. Di seguito includo il codice R per calcolare questo test.

# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))

# sample with replacement
resample <- function(X) sample(X, replace=TRUE)

# return true if mu1 < mu2 < mu3
test     <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)

# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.