Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

7
Perché l'accuratezza della convalida fluttua?
Ho una CNN a quattro strati per prevedere la risposta al cancro usando i dati della risonanza magnetica. Uso le attivazioni ReLU per introdurre non linearità. L'accuratezza e la perdita del treno aumentano e diminuiscono monotonicamente rispettivamente. Ma la precisione del mio test inizia a fluttuare selvaggiamente. Ho provato a …

1
Uso improprio di convalida incrociata (segnalazione delle prestazioni per il miglior valore di iperparametro)
Di recente mi sono imbattuto in un documento che propone di utilizzare un classificatore k-NN su un set di dati specifico. Gli autori hanno utilizzato tutti i campioni di dati disponibili per eseguire la convalida incrociata k-fold per diversi valori k e riportare i risultati della convalida incrociata della migliore …

6
Se un intervallo credibile ha un precedente fisso, un intervallo di confidenza al 95% equivale a un intervallo credibile al 95%?
Sono molto nuovo nelle statistiche bayesiane e questa potrebbe essere una domanda sciocca. Tuttavia: Considera un intervallo credibile con un precedente che specifica una distribuzione uniforme. Ad esempio, da 0 a 1, dove 0 a 1 rappresenta l'intero intervallo di possibili valori di un effetto. In questo caso, un intervallo …

2
Abbiamo bisogno della discesa del gradiente per trovare i coefficienti di un modello di regressione lineare?
Stavo cercando di imparare l'apprendimento automatico usando il materiale Coursera . In questa lezione, Andrew Ng utilizza l'algoritmo di discesa gradiente per trovare i coefficienti del modello di regressione lineare che minimizzerà la funzione di errore (funzione di costo). Per la regressione lineare, abbiamo bisogno di una discesa gradiente? Sembra …

3
In che modo Naive Bayes è un classificatore lineare?
Ho visto l'altro thread qui, ma non credo che la risposta abbia soddisfatto la vera domanda. Quello che ho letto continuamente è che Naive Bayes è un classificatore lineare (es: qui ) (tale da tracciare un confine di decisione lineare) usando la dimostrazione delle probabilità del log. Tuttavia, ho simulato …


3
Errore quadratico medio e somma dei quadrati residua
Guardando le definizioni di Wikipedia di: Errore al quadrato medio (MSE) Somma dei quadrati residua (RSS) Mi sembra quello MSE = 1NRSS = 1N∑ ( fio- yio)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 dove NNN è colui numero di campioni e fiofif_i è la nostra stima yioyiy_i . …
31 residuals  mse 


2
Importanza relativa di una serie di predittori in una classificazione casuale delle foreste in R
Vorrei determinare l'importanza relativa degli insiemi di variabili verso un randomForestmodello di classificazione in R. La importancefunzione fornisce la MeanDecreaseGinimetrica per ogni singolo predittore - è semplice come sommare questo attraverso ciascun predittore in un insieme? Per esempio: # Assumes df has variables a1, a2, b1, b2, and outcome rf …

4
Quando è valida la stima bootstrap del bias?
Si afferma spesso che il bootstrap può fornire una stima della distorsione in uno stimatore. Se t è la stima per qualche statistica, e ~ t i sono le repliche bootstrap (con i ∈ { 1 , ⋯ , N } ), allora la stima bootstrap di polarizzazione è che …
31 bootstrap  bias 

2
formato dati libsvm [chiuso]
Sto usando lo strumento libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) per la classificazione dei vettori di supporto. Tuttavia, sono confuso sul formato dei dati di input. Dal README: Il formato del file di dati di addestramento e test è: <label> <index1>:<value1> <index2>:<value2> ... . . . Ogni riga contiene un'istanza ed è …





Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.