Le distribuzioni di campionamento sono legittime per deduzione?


15

Alcuni bayesiani attaccano l'inferenza del frequentatore affermando che "non esiste una distribuzione campionaria unica" perché dipende dalle intenzioni del ricercatore (Kruschke, Aguinis e Joo, 2012, p. 733).

Ad esempio, supponiamo che un ricercatore inizi la raccolta dei dati, ma il suo finanziamento è stato inaspettatamente tagliato dopo 40 partecipanti. Come potrebbero essere definite qui le distribuzioni di campionamento (e i successivi CI e valori p)? Supponiamo che ogni campione costituente abbia N = 40? O sarebbe costituito da campioni con N diversi, con ciascuna dimensione determinata da altre volte casuali in cui il suo finanziamento potrebbe essere stato tagliato?

La t, F, chi-quadrato (ecc.), Le distribuzioni nulle trovate nei libri di testo presuppongono tutti che la N sia fissa e costante per tutti i campioni costituenti, ma ciò potrebbe non essere vero nella pratica. Con ogni diversa procedura di arresto (ad esempio, dopo un certo intervallo di tempo o fino a quando il mio assistente non si stanca) sembra che ci sia una diversa distribuzione di campionamento e l'uso di queste distribuzioni "N" provate e vere "è inappropriato.

Quanto è dannosa questa critica alla legittimità degli IC e dei valori p frequenti? Ci sono confutazioni teoriche? Sembra che attaccando il concetto di distribuzione campionaria, l'intero edificio dell'inferenza del frequentista sia tenue.

Eventuali riferimenti accademici sono molto apprezzati.


1
La citazione è per: Kruschke, JK, Aguinis, H., & Joo, H. (2012). È giunto il momento: metodi bayesiani per l'analisi dei dati nelle scienze organizzative. Ma Kruschke l'ha già usato in: (2010) Analisi dei dati bayesiani e (2010) Cosa credere: metodi bayesiani per l'analisi dei dati.
ATJ,

Risposte:


21

n

n

XnX¯Kμ=0μ0L(0)L(X¯)e-K2/2KKadane (1996), "Ragionamento per una conclusione scontata", JASA , 91 , 435

Sottolineare la dipendenza dell'inferenza del frequentatore dalle intenzioni di un ricercatore è un utile scavo per le persone (se ce ne sono ancora) che salgono in sella alla "soggettività" dell'inferenza bayesiana. Personalmente, posso conviverci; l'esecuzione di una procedura su una lunga serie di ripetizioni sarà sempre qualcosa di più o meno nozionale, il che non toglie che sia una cosa utile da considerare ("una calibrazione della probabilità" è stato il modo in cui Cox ha descritto i valori p ). Dalle date dei riferimenti potresti aver notato che questi problemi non sono molto nuovi; i tentativi di risolverli con argomentazioni a priori sono in gran parte decaduti (tranne su Internet, sempre indietro rispetto ai tempi tranne che in questioni banali) &

PS: Pensando di aggiungere un contrappeso a Berger & Wolpert mi sono imbattuto in Cox & Mayo (2010), "Obiettività e condizionalità nell'inferenza frequentista" in Errore e inferenza . C'è molto probabilmente un elemento di pio desiderio nella mia affermazione che il dibattito si è spento, ma è sorprendente quanto poco ci sia da dire sulla questione dopo circa mezzo secolo. (Tuttavia, questa è una difesa concisa ed eloquente delle idee frequentiste.)


1
+1 (molto tempo fa). Mi chiedo se il ragionamento di Armitage possa essere adattato al noto esempio di campionamento binomiale vs neg-binomiale; ad es. osservando la sequenza TTTTTH dei lanci di monete si ottiene p = 0,03 o p = 0,1 a seconda della regola di arresto. Quindi, se ora consideriamo ancora un'altra regola l'arresto, ad esempio, "Keep lancio fino p binomio <0.05 e c'era almeno una H ed almeno un T", quindi diventa piuttosto intuitivo che si dovrebbe piuttosto non ignorare questa regola arresto per l'inferenza (nonostante violi il principio di verosimiglianza). ha senso?
ameba dice Ripristina Monica il

4

La risposta breve alla tua domanda è: dipende da chi chiedi ;-) I duri Bayesiani dichiareranno la vittoria sulla, o almeno la parità con, la metodologia frequentista. I frequentatori irriducibili saranno automaticamente "Non è possibile rispondere". L'altro 99% degli statistici utilizzerà qualsiasi metodo che si è dimostrato affidabile in esperimenti inerrotti.

So che la sensibilità della distribuzione campionaria alle intenzioni del ricercatore può essere preoccupante e non esiste davvero una buona soluzione a questo problema. Sia i bayesiani che i frequentisti devono usare un po 'di soggettività e giudizio per decidere come formulare un'inferenza. Tuttavia, penso che stai prendendo un esempio da un'area generalmente controversa e ponendo i problemi esclusivamente ai piedi dell'inferenza del frequentatore. Gli esperimenti sequenziali e / o interrotti sono esempi classici della natura soggettiva dell'inferenza ... e alla quale non esiste una risposta assolutamente obiettiva e concordata.

Che dire dell'inferenza regolare, dove effettivamente raccogli il campione che intendevi ottenere? Qui, penso che i frequentatori abbiano il sopravvento, poiché i valori di CI e p sono ben calibrati rispetto alle loro ripetute proprietà di campionamento, mentre l'inferenza bayesiana conserva la sua natura personale e soggettiva.

Se volete un'esposizione più teorica della risposta bayesiana, vorrei leggere "inferenza condizionale" con ricercatori chiave come Nancy Reid e Lehmann.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.