Grande campione asintotico / teoria - Perché preoccuparsene?


13

Spero che questa domanda non venga contrassegnata "come troppo generale" e spero che inizi una discussione a beneficio di tutti.

In statistica, dedichiamo molto tempo all'apprendimento di grandi teorie campionarie. Siamo profondamente interessati a valutare le proprietà asintotiche dei nostri stimatori, incluso se sono asintoticamente imparziali, asintoticamente efficienti, la loro distribuzione asintotica e così via. La parola asintotica è fortemente legata al presupposto che .n

In realtà, tuttavia, abbiamo sempre a che fare con . Le mie domande sono:n

1) cosa intendiamo per grande campione? Come possiamo distinguere tra campioni piccoli e grandi?

2) Quando diciamo n , intendiamo letteralmente che n dovrebbe andare a ?

ex per la distribuzione binomiale, X¯ bisogno di circa n = 30 per convergere alla distribuzione normale sotto CLT. Dovremmo avere n o in questo caso per intendiamo 30 o più ?!

3) Supponiamo di avere un campione finito e supponiamo di sapere tutto sul comportamento asintotico dei nostri stimatori. E allora? supponiamo che i nostri stimatori siano asintoticamente imparziali, allora abbiamo una stima imparziale per il nostro parametro di interesse nel nostro campione finito o significa che se avessimo , allora avremmo uno imparziale?n

Come puoi vedere dalle domande precedenti, sto cercando di capire la filosofia dietro "Grandi campioni asintotici" e di capire perché ci teniamo? Ho bisogno di avere alcune intuizioni per i teoremi che sto imparando.


5
Il comportamento di campioni di grandi dimensioni è un modo per dimostrare che un determinato stimatore funziona o qualsiasi altra cosa nel limite di dati infiniti. Hai ragione sul fatto che non ci dice necessariamente quanto sia buono uno stimatore in pratica, ma è un primo passo: è improbabile che tu voglia usare uno stimatore che non è asintoticamente coerente (o qualsiasi altra cosa). Il vantaggio dell'analisi asintotica è che spesso è più facile da capire rispetto a un campione finito.
Dougal,

Dovresti iniziare a leggere sugli asintotici di ordine superiore, poiché apparentemente conosci solo la normalità asintotica di primo ordine e simili; con ciò, non sai ancora tutto sul comportamento asintotico. È come dire "So che ; perché tutti dicono che il seno è periodico ???". SionX=X
StasK,

1
Per la distribuzione binomiale, è un criterio scadente. Se hai p = 0,001 e n = 30 , la media = 0,03 e sd = 0,173, quindi al valore nominale, la probabilità che la variabile binomiale sia inferiore a zero tramite l'approssimazione normale è del 43%, che a malapena è un'approssimazione accettabile per zero . Regole migliori suggeriscono n min ( p , 1 - p ) > 15 e tengono conto di questi problemi di ordine superiore. n>30p=0.001n=30nmin(p,1-p)>15
StasK,

Risposte:


6

Meglio tardi che mai. Vorrei prima elencare tre (penso importanti) motivi per cui ci concentriamo sull'imparzialità asintotica (coerenza) degli stimatori.

a) La coerenza è un criterio minimo. Se uno stimatore non stima correttamente anche con molti dati, a che serve? Questa è la giustificazione fornita in Wooldridge: introduttiva di econometria.

b) Le proprietà del campione finito sono molto più difficili da dimostrare (o meglio, le dichiarazioni asintotiche sono più facili). Attualmente sto facendo delle ricerche da solo, e ogni volta che puoi fare affidamento su grandi strumenti di esempio, le cose diventano molto più facili. Leggi di grandi numeri, teoremi di convergenza della martingala, ecc. Sono buoni strumenti per ottenere risultati asintotici, ma non aiutano con campioni finiti. Credo che qualcosa del genere sia menzionato in Hayashi (2000): Econometria.

c) Se gli stimatori sono distorti per piccoli campioni, si può potenzialmente correggere o almeno migliorare con le cosiddette piccole correzioni dei campioni. Questi sono spesso teoricamente complicati (per dimostrare che migliorano sullo stimatore senza la correzione). Inoltre, la maggior parte delle persone sta bene affidandosi a campioni di grandi dimensioni, quindi le piccole correzioni dei campioni spesso non sono implementate nel software statistico standard, perché solo poche persone li richiedono (quelli che non possono ottenere più dati E si preoccupano dell'imparzialità). Pertanto, vi sono alcuni ostacoli all'utilizzo di quelle correzioni non comuni.

Sulle tue domande Cosa intendiamo per "campione di grandi dimensioni"? Ciò dipende fortemente dal contesto e, per strumenti specifici, è possibile rispondere tramite simulazione. Cioè, si generano artificialmente dati e si vede come, diciamo, il tasso di rifiuto si comporta come una funzione della dimensione del campione o il bias si comporta come una funzione della dimensione del campione. Un esempio specifico è qui , in cui gli autori vedono quanti cluster sono necessari per gli errori standard cluster OLS, per bloccare errori standard bootstraped ecc. Per funzionare bene. Alcuni teorici hanno anche dichiarazioni sul tasso di convergenza, ma per scopi pratici le simulazioni sembrano essere più informative.

n

Alla domanda 3: di solito, la questione dell'imparzialità (per tutte le dimensioni del campione) e della coerenza (imparzialità per campioni di grandi dimensioni) è considerata separatamente. Uno stimatore può essere distorto, ma coerente, nel qual caso in effetti solo le grandi stime del campione sono imparziali. Ma ci sono anche stimatori che sono imparziali e coerenti, che sono teoricamente applicabili a qualsiasi dimensione del campione. ( Uno stimatore può anche essere imparziale ma incoerente per motivi tecnici. )

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.