Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

6
Foresta casuale - Come gestire l'overfitting
Ho una preparazione informatica ma sto cercando di insegnarmi la scienza dei dati risolvendo problemi su Internet. Ho lavorato su questo problema per le ultime due settimane (circa 900 righe e 10 funzioni). Inizialmente stavo usando la regressione logistica, ma ora sono passato a foreste casuali. Quando eseguo il mio …

4
Regressione logistica in R (Odds Ratio)
Sto cercando di intraprendere un'analisi della regressione logistica in R. Ho frequentato corsi su questo materiale usando STATA. Sto trovando molto difficile replicare la funzionalità in R. È maturo in questa zona? Sembra che ci sia poca documentazione o guida disponibile. La produzione di output odds ratio sembra richiedere l'installazione …
41 r  logistic  odds-ratio 




6
Quando utilizzare le simulazioni?
Quindi questa è una domanda molto semplice e stupida. Tuttavia, quando ero a scuola, ho prestato pochissima attenzione all'intero concetto di simulazioni in classe e questo mi ha lasciato un po 'terrorizzato da quel processo. Puoi spiegare il processo di simulazione in termini di laici? (potrebbe essere per la generazione …
40 simulation 

3
Come presentare i risultati di un Lazo usando glmnet?
Vorrei trovare predittori per una variabile dipendente continua tra un set di 30 variabili indipendenti. Sto usando la regressione di Lasso come implementato nel pacchetto glmnet in R. Ecco un codice fittizio: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # …

4
Richiamo e precisione nella classificazione
Ho letto alcune definizioni di richiamo e precisione, anche se è sempre nel contesto del recupero delle informazioni. Mi chiedevo se qualcuno potesse spiegarlo un po 'di più in un contesto di classificazione e forse illustrare alcuni esempi. Ad esempio, ho un classificatore binario che mi dà una precisione del …





3
Considera la somma di distribuzioni uniformi su o . Perché la cuspide nel PDF di scompare per ?
Mi sono chiesto questo per un po '; Lo trovo un po 'strano quanto bruscamente succede. Fondamentalmente, perché abbiamo bisogno di solo tre uniformi per per appianare come fa? E perché il livellamento avviene in modo relativamente rapido?ZnZnZ_n Z2Z2Z_2 : Z3Z3Z_3 : (immagini rubate senza vergogna dal blog di John …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.