Statistiche e Big Data small-sample

3

Bootstrap: il problema del sovradimensionamento

Supponiamo che uno esegua il cosiddetto bootstrap non parametrico tracciando campioni di dimensioni n ciascuno ciascuno dalle n osservazioni originali con sostituzione. Credo che questa procedura equivale a stimare la funzione di distribuzione cumulativa dal cdf empirico:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function e quindi ottenere i campioni di bootstrap simulando osservazioni dalla stima b …

14 bootstrap sample-size sample small-sample finite-population

7

Vale la pena modellare le serie storiche brevi?

Ecco un po 'di contesto. Sono interessato a determinare in che modo due variabili ambientali (temperatura, livelli di nutrienti) influiscono sul valore medio di una variabile di risposta in un periodo di 11 anni. All'interno di ogni anno sono disponibili dati provenienti da oltre 100.000 località. L'obiettivo è determinare se, …

14 time-series regression sample-size small-sample

4

Rappresentazione grafica di piccoli campioni

Ho un piccolo set di dati di 14 tempi separati per completare un'attività. Tuttavia, ho difficoltà a trovare un grafico appropriato da utilizzare per rappresentare graficamente i dati. Se il campione fosse più grande, utilizzerei un diagramma a scatole o un istogramma, ma non sono sicuro che sarebbe opportuno utilizzare …

13 data-visualization descriptive-statistics small-sample

1

Sequenza di Halton vs sequenza di Sobol?

Da una risposta in una domanda precedente , sono stato indirizzato verso la sequenza di Halton, per aver creato una serie di vettori che coprivano uno spazio campione uniformemente uniformemente. Ma la pagina di Wikipedia menziona che i numeri primi più alti sono spesso altamente correlati all'inizio della serie. Questo …

13 sampling small-sample quasi-monte-carlo

2

Random Forest è adatto a set di dati molto piccoli?

Ho un set di dati che comprende 24 righe di dati mensili. Le caratteristiche sono PIL, arrivi in aeroporto, mese e pochi altri. La variabile dipendente è il numero di visitatori verso una destinazione turistica popolare. Random Forest sarebbe adatto a un simile problema? I dati non sono pubblici, quindi …

13 random-forest small-sample

1

ANOVA: test sull'ipotesi di normalità per molti gruppi con pochi campioni per gruppo

Supponiamo la seguente situazione: abbiamo un numero elevato (ad es. 20) con gruppi di piccole dimensioni (ad es. n = 3). Ho notato che se generi valori dalla distribuzione uniforme, i residui appariranno approssimativamente normali anche se la distribuzione dell'errore è uniforme. Il seguente codice R dimostra questo comportamento: n.group …

12 anova normal-distribution small-sample

1

test vs test?

Sto cercando di capire esattamente quale sia la differenza tra test e test.tttzzz Per quanto ne so, per entrambe le classi di test si usa la stessa statistica test, qualcosa del modulo b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} dove è una statistica di esempio, è una costante di riferimento (posizione) (che dipende dai …

12 hypothesis-testing t-test small-sample

2

La randomizzazione è affidabile con piccoli campioni?

Jerome Cornfield ha scritto: Uno dei migliori frutti della rivoluzione dei Pescatori fu l'idea della randomizzazione, e gli statistici che concordano su poche altre cose hanno almeno concordato su questo. Ma nonostante questo accordo e nonostante l'uso diffuso di procedure di allocazione randomizzate in cliniche e in altre forme di …

11 small-sample random-allocation

3

Limiti ai metodi di ensemble basati su alberi in piccoli problemi n, grandi p?

Metodi di ensemble basati su alberi come Random Forest e derivati successivi (ad esempio, foresta condizionale), tutti pretendono di essere utili nei cosiddetti problemi "small n , large p ", per identificare l'importanza della variabile relativa. In effetti, questo sembra essere il caso, ma la mia domanda è fino a …

10 random-forest small-sample ensemble

1

Regressione con dimensioni del campione molto ridotte

Voglio eseguire una regressione con 4-5 variabili esplicative, ma ho solo 15 osservazioni. Non potendo assumere che queste variabili siano normalmente distribuite, esiste un metodo di regressione non parametrico o di altro tipo?

9 regression small-sample

Domande taggate «small-sample»