Si riferisce a complicazioni o problemi statistici dovuti alla mancanza di dati. Se la tua domanda riguarda un piccolo campione relativo al numero di variabili, utilizza invece il tag [sottodeterminato].
Supponiamo che uno esegua il cosiddetto bootstrap non parametrico tracciando campioni di dimensioni n ciascuno ciascuno dalle n osservazioni originali con sostituzione. Credo che questa procedura equivale a stimare la funzione di distribuzione cumulativa dal cdf empirico:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function e quindi ottenere i campioni di bootstrap simulando osservazioni dalla stima b …
Ecco un po 'di contesto. Sono interessato a determinare in che modo due variabili ambientali (temperatura, livelli di nutrienti) influiscono sul valore medio di una variabile di risposta in un periodo di 11 anni. All'interno di ogni anno sono disponibili dati provenienti da oltre 100.000 località. L'obiettivo è determinare se, …
Ho un piccolo set di dati di 14 tempi separati per completare un'attività. Tuttavia, ho difficoltà a trovare un grafico appropriato da utilizzare per rappresentare graficamente i dati. Se il campione fosse più grande, utilizzerei un diagramma a scatole o un istogramma, ma non sono sicuro che sarebbe opportuno utilizzare …
Da una risposta in una domanda precedente , sono stato indirizzato verso la sequenza di Halton, per aver creato una serie di vettori che coprivano uno spazio campione uniformemente uniformemente. Ma la pagina di Wikipedia menziona che i numeri primi più alti sono spesso altamente correlati all'inizio della serie. Questo …
Ho un set di dati che comprende 24 righe di dati mensili. Le caratteristiche sono PIL, arrivi in aeroporto, mese e pochi altri. La variabile dipendente è il numero di visitatori verso una destinazione turistica popolare. Random Forest sarebbe adatto a un simile problema? I dati non sono pubblici, quindi …
Supponiamo la seguente situazione: abbiamo un numero elevato (ad es. 20) con gruppi di piccole dimensioni (ad es. n = 3). Ho notato che se generi valori dalla distribuzione uniforme, i residui appariranno approssimativamente normali anche se la distribuzione dell'errore è uniforme. Il seguente codice R dimostra questo comportamento: n.group …
Sto cercando di capire esattamente quale sia la differenza tra test e test.tttzzz Per quanto ne so, per entrambe le classi di test si usa la stessa statistica test, qualcosa del modulo b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} dove è una statistica di esempio, è una costante di riferimento (posizione) (che dipende dai …
Jerome Cornfield ha scritto: Uno dei migliori frutti della rivoluzione dei Pescatori fu l'idea della randomizzazione, e gli statistici che concordano su poche altre cose hanno almeno concordato su questo. Ma nonostante questo accordo e nonostante l'uso diffuso di procedure di allocazione randomizzate in cliniche e in altre forme di …
Metodi di ensemble basati su alberi come Random Forest e derivati successivi (ad esempio, foresta condizionale), tutti pretendono di essere utili nei cosiddetti problemi "small n , large p ", per identificare l'importanza della variabile relativa. In effetti, questo sembra essere il caso, ma la mia domanda è fino a …
Voglio eseguire una regressione con 4-5 variabili esplicative, ma ho solo 15 osservazioni. Non potendo assumere che queste variabili siano normalmente distribuite, esiste un metodo di regressione non parametrico o di altro tipo?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.