Qual è l'intuizione dietro i campioni scambiabili sotto l'ipotesi nulla?


15

I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita di maggiori informazioni. Tuttavia, un solo presupposto non deve essere trascurato quando si utilizza questo tipo di test è il presupposto della scambiabilità dei campioni secondo l'ipotesi nulla. È anche interessante notare che questo tipo di approccio può essere applicato anche quando ci sono più di due campioni come quello implementato nel coinpacchetto R.

Potete per favore usare un linguaggio figurativo o un'intuizione concettuale in un inglese semplice per illustrare questo assunto? Ciò sarebbe molto utile per chiarire questo problema trascurato tra i non statistici come me.

Nota:
sarebbe molto utile menzionare un caso in cui l'applicazione di un test di permutazione non è valida o non è valida sotto lo stesso presupposto.

Aggiornamento:
Supponi di avere 50 soggetti raccolti dalla clinica locale nel mio distretto a caso. Sono stati assegnati in modo casuale al farmaco ricevuto o al placebo con rapporto 1: 1. Sono stati tutti misurati per il parametro 1 Par1a V1 (basale), V2 (3 mesi dopo) e V3 (1 anno dopo). Tutti e 50 i soggetti possono essere suddivisi in 2 gruppi in base alla caratteristica A; A positivo = 20 e A negativo = 30. Possono anche essere suddivisi in altri 2 gruppi in base alla caratteristica B; B positivo = 15 e B negativo = 35.
Ora, ho valori di Par1da tutte le materie in tutte le visite. Con il presupposto della scambiabilità, posso fare un confronto tra i livelli di Par1utilizzo del test di permutazione se dovessi:
- Confrontare i soggetti con il farmaco con quelli che hanno ricevuto il placebo a V2?
- Confronta i soggetti con la funzione A con quelli che hanno la funzione B in V2?
- Confrontare i soggetti con la funzione A in V2 con quelli che hanno la funzione A ma in V3?
- In quale situazione questo confronto non sarebbe valido e violerebbe il presupposto della scambiabilità?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Supponiamo di avere ogni osservazione su un foglio separato di carta a fogli mobili e mentre ti consegnavo la pila, scivolavo e i fogli uscivano volando in tutte le direzioni mentre si posavano sul pavimento. Sarebbe un peccato se ciò distruggesse la validità del test che speravi di eseguire su quei dati. Se le tue osservazioni sono intercambiabili e stavi applicando un test basato su quello, mi conforteresti e mi diresti di non preoccuparmi mentre mi aiuti a raccogliere i documenti dal pavimento. Altrimenti, e la raccolta dei dati è stata particolarmente costosa, potrei dover correre per la mia vita.
cardinale il

2
D'altra parte, l'ordine non importa per cose come dati di serie (in generale) e test dovrebbe essere generalmente rispettare questo ordine in modo appropriato.
cardinale il

@cardinale, mentre la tua storia intuitiva ha tracciato un'immagine vivida di come appare questa ipotesi, ma sono ancora confuso su come giudicare se i preziosi documenti caduti fossero scambiabili o meno. Puoi correre per un altro commento se è possibile!
dottorato il

Risposte:


7

fXYZ(X=1,y=3,z=2)=fXYZ(X=3,y=2,z=1), eccetera). In caso contrario, contare le permutazioni non è un modo valido per testare l'ipotesi nulla, poiché ogni permutazione avrà un peso diverso (probabilità / densità). I test di permutazione dipendono da ogni assegnazione di un determinato set di valori numerici alle variabili con la stessa densità / probabilità.

f(X1=1,X2=2,X3=3 ...XN=N)f(X1=N,X2=N-1,X3=N-2 ...XN=1)


+1, sebbene la scambiabilità sia ben spiegata, ma ero ancora inciampato nel tentativo di applicare la metafora dei vasi sullo studio in mano. (vedi l'aggiornamento della domanda). Data la durata delle visite e dei sottogruppi basati sulle funzionalità, come posso giudicare se il confronto di questi valori sarebbe scambiabile o no?
dottorato il

@doctorate: sembra che tu stia stratificando i tuoi gruppi in base a fattori rilevanti per il risultato di Par1, giusto? Fintanto che stai usando permutazioni all'interno di un particolare quadrante fetale A / B, suppongo che i tuoi soggetti siano scambiabili. Il tuo primo test, che attraverserà le funzionalità, dovrà essere ulteriormente elaborato prima di poter utilizzare un test che si basa sulla scambiabilità. in particolare, è necessario quantificare l'effetto del trattamento e correggere gli effetti confondenti delle funzioni A e B; in caso contrario, le dimensioni del gruppo influenzeranno i risultati complessivi (paradosso di Simpson)

1
@doctorate: mi sono reso conto che il mio commento sopra potrebbe essere stato un po 'obliquo, quello che vuoi: i barattoli nel tuo caso sarebbero le coppie di caratteristiche, cioè (A +, B +), (A-, B +), (A +, B -), (B-, A-) per un totale di 4 "vasetti". Questo aiuta a renderlo più concreto?

Tks, ma cosa confonde i non statistici come me, come si può giudicare se questa ipotesi è stata soddisfatta o no? ci sono spesso test per esaminare ipotesi, ad esempio, per la normalità c'è il test di Shapiro-Wilk. Ma mi chiedo quale test esaminerebbe la scambiabilità? altrimenti sarebbe una definizione molto difficile o vaga e due statistici potrebbero non essere d'accordo su questo o quel sottogruppo. Come hai detto, nel quadrante A / B nessun problema, ma in Drug / Placebo hai mostrato qualche preoccupazione. Quindi esiste un test dell'acido per questo assunto?
dottorato

2
Per quanto riguarda la scambiabilità, non esiste un "test" per la scambiabilità. A differenza dell'indipendenza (che è testabile), la scambiabilità è più di un presupposto modellistico che se avessi preso campioni ripetuti come quello che hai preso, scopriresti che ogni permutazione avviene esattamente nella stessa frazione del tempo. Hai solo 1 campione, quindi non puoi "testarlo".
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.