Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



11
Podcast statistici
Quali sono alcuni podcast relativi all'analisi statistica? Ho trovato alcune registrazioni audio delle lezioni del college su ITunes U, ma non sono a conoscenza di alcun podcast statistico. La cosa più vicina di cui sono a conoscenza è un podcast di ricerca operativa The Science of Better . Tocca questioni …
29 references 


6
Procedura di selezione variabile per la classificazione binaria
Quali sono le selezioni variabili / caratteristiche che preferisci per la classificazione binaria quando ci sono molte più variabili / caratteristiche rispetto alle osservazioni nel set di apprendimento? Lo scopo qui è discutere qual è la procedura di selezione delle caratteristiche che riduce al meglio l'errore di classificazione. Possiamo correggere …


6
Test per varianza finita?
È possibile verificare la finezza (o l'esistenza) della varianza di una variabile casuale dato un campione? Come null, {la varianza esiste ed è finita} o {la varianza non esiste / è infinita} sarebbe accettabile. Filosoficamente (e computazionalmente), questo sembra molto strano perché non ci dovrebbero essere differenze tra una popolazione …

3
Che cos'è una varietà?
Nella tecnica di riduzione della dimensionalità come Analisi dei componenti principali, LDA ecc. Viene spesso utilizzato il termine collettore. Che cos'è una varietà in termini non tecnici? Se un punto appartiene ad una sfera il cui voglio ridurre, e se v'è un rumore dimensione ed ed sono incorrelati, allora i …

1
Quali sono le carenze dell'errore di percentuale assoluta media (MAPE)?
L' errore percentuale assoluta media ( mape ) è una misura di precisione o di errore comune per serie temporali o altre previsioni, MAPE = 100nΣt = 1n| UNt- Ft|UNt% ,MAPE=100n∑t=1n|At−Ft|At%, \text{MAPE} = \frac{100}{n}\sum_{t=1}^n\frac{|A_t-F_t|}{A_t}\%, dove sono effettivi e previsioni o previsioni corrispondenti.F tUNtAtA_tFtFtF_t Il MAPE è una percentuale, quindi possiamo …
29 accuracy  mape 

1
Intervallo di previsione Bootstrap
È disponibile una tecnica bootstrap per calcolare gli intervalli di previsione per le previsioni dei punti ottenute ad esempio dalla regressione lineare o altro metodo di regressione (k-vicino più vicino, alberi di regressione ecc.)? In qualche modo ritengo che il modo a volte proposto di avviare semplicemente la previsione del …

2
Perché usare la validazione incrociata stratificata? Perché questo non danneggia i benefici correlati alla varianza?
Mi è stato detto che è utile utilizzare la validazione incrociata stratificata, specialmente quando le classi di risposta sono sbilanciate. Se uno scopo della convalida incrociata è quello di aiutare a spiegare la casualità del nostro campione di dati di allenamento originale, fare sicuramente ogni piega con la stessa distribuzione …

4
Interpretazione pseudo-R2 di McFadden
Ho un modello di regressione logistica binaria con uno pseudo R-quadrato di McFadden di 0,192 con una variabile dipendente chiamata payment (1 = pagamento e 0 = nessun pagamento). Qual è l'interpretazione di questo pseudo R-quadrato? È un confronto relativo per i modelli nidificati (ad esempio un modello a 6 …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.