Statistiche e Big Data

7

Perché l'accuratezza della convalida fluttua?

Ho una CNN a quattro strati per prevedere la risposta al cancro usando i dati della risonanza magnetica. Uso le attivazioni ReLU per introdurre non linearità. L'accuratezza e la perdita del treno aumentano e diminuiscono monotonicamente rispettivamente. Ma la precisione del mio test inizia a fluttuare selvaggiamente. Ho provato a …

31 machine-learning python deep-learning

1

Uso improprio di convalida incrociata (segnalazione delle prestazioni per il miglior valore di iperparametro)

Di recente mi sono imbattuto in un documento che propone di utilizzare un classificatore k-NN su un set di dati specifico. Gli autori hanno utilizzato tutti i campioni di dati disponibili per eseguire la convalida incrociata k-fold per diversi valori k e riportare i risultati della convalida incrociata della migliore …

31 cross-validation references model-selection model-evaluation

6

Se un intervallo credibile ha un precedente fisso, un intervallo di confidenza al 95% equivale a un intervallo credibile al 95%?

Sono molto nuovo nelle statistiche bayesiane e questa potrebbe essere una domanda sciocca. Tuttavia: Considera un intervallo credibile con un precedente che specifica una distribuzione uniforme. Ad esempio, da 0 a 1, dove 0 a 1 rappresenta l'intero intervallo di possibili valori di un effetto. In questo caso, un intervallo …

31 bayesian confidence-interval estimation prior credible-interval

2

Abbiamo bisogno della discesa del gradiente per trovare i coefficienti di un modello di regressione lineare?

Stavo cercando di imparare l'apprendimento automatico usando il materiale Coursera . In questa lezione, Andrew Ng utilizza l'algoritmo di discesa gradiente per trovare i coefficienti del modello di regressione lineare che minimizzerà la funzione di errore (funzione di costo). Per la regressione lineare, abbiamo bisogno di una discesa gradiente? Sembra …

31 regression machine-learning linear-model gradient-descent

3

In che modo Naive Bayes è un classificatore lineare?

Ho visto l'altro thread qui, ma non credo che la risposta abbia soddisfatto la vera domanda. Quello che ho letto continuamente è che Naive Bayes è un classificatore lineare (es: qui ) (tale da tracciare un confine di decisione lineare) usando la dimostrazione delle probabilità del log. Tuttavia, ho simulato …

31 classification naive-bayes

4

È vero che il bootstrap percentile non dovrebbe mai essere usato?

Nelle note del MIT OpenCourseWare per la 18.05 Introduzione a Probabilità e statistiche, primavera 2014 (attualmente disponibile qui ), si afferma: Il metodo percentile bootstrap è attraente per la sua semplicità. Tuttavia dipende dalla distribuzione bootstrap di base al fatto che un particolare campione rappresenta una buona approssimazione alla vera …

31 confidence-interval bootstrap

3

Errore quadratico medio e somma dei quadrati residua

Guardando le definizioni di Wikipedia di: Errore al quadrato medio (MSE) Somma dei quadrati residua (RSS) Mi sembra quello MSE = 1NRSS = 1N∑ ( fio- yio)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 dove NNN è colui numero di campioni e fiofif_i è la nostra stima yioyiy_i . …

31 residuals mse

4

Regressione logistica - Termine di errore e sua distribuzione

Sull'esistenza di un termine di errore nella regressione logistica (e nella sua presunta distribuzione), ho letto in vari punti che: non esiste alcun termine di errore il termine di errore ha una distribuzione binomiale (in conformità con la distribuzione della variabile di risposta) il termine di errore ha una distribuzione …

31 logistic binomial bernoulli-distribution logistic-distribution

2

Importanza relativa di una serie di predittori in una classificazione casuale delle foreste in R

Vorrei determinare l'importanza relativa degli insiemi di variabili verso un randomForestmodello di classificazione in R. La importancefunzione fornisce la MeanDecreaseGinimetrica per ogni singolo predittore - è semplice come sommare questo attraverso ciascun predittore in un insieme? Per esempio: # Assumes df has variables a1, a2, b1, b2, and outcome rf …

31 r machine-learning classification random-forest

4

Quando è valida la stima bootstrap del bias?

Si afferma spesso che il bootstrap può fornire una stima della distorsione in uno stimatore. Se t è la stima per qualche statistica, e ~ t i sono le repliche bootstrap (con i ∈ { 1 , ⋯ , N } ), allora la stima bootstrap di polarizzazione è che …

31 bootstrap bias

2

formato dati libsvm [chiuso]

Sto usando lo strumento libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) per la classificazione dei vettori di supporto. Tuttavia, sono confuso sul formato dei dati di input. Dal README: Il formato del file di dati di addestramento e test è: <label> <index1>:<value1> <index2>:<value2> ... . . . Ogni riga contiene un'istanza ed è …

31 machine-learning svm python libsvm c++

3

È possibile calcolare AIC e BIC per i modelli di regressione del lazo?

È possibile calcolare i valori AIC o BIC per i modelli di regressione del lazo e altri modelli regolarizzati in cui i parametri entrano solo parzialmente nell'equazione. Come si determinano i gradi di libertà? Sto usando R per adattare i modelli di regressione del lazo con la glmnet()funzione del glmnetpacchetto …

31 r model-selection lasso aic bic

3

Quale distribuzione seguono i miei dati?

Diciamo che ho 1000 componenti e ho raccolto dati su quante volte questi registrano un errore e ogni volta che hanno registrato un errore, tengo anche traccia del tempo impiegato dal mio team per risolvere il problema. In breve, ho registrato il tempo di riparazione (in secondi) per ciascuno di …

31 distributions data-visualization survival reliability distribution-identification

2

Residui grezzi contro residui standardizzati rispetto ai residui studentizzati: cosa usare quando?

Questo si presenta come una domanda simile e non ha ottenuto molte risposte. Omettendo test come Cook's D e osservando i residui come gruppo, sono interessato a come gli altri usano i residui quando valutano la bontà di adattamento. Uso i residui grezzi: in un diagramma QQ, per valutare la …

31 goodness-of-fit residuals

6

Il grafico a linee ha troppe linee, esiste una soluzione migliore?

Sto cercando di rappresentare graficamente il numero di azioni degli utenti (in questo caso "Mi piace") nel tempo. Quindi ho "Numero di azioni" come il mio asse y, il mio asse x è il tempo (settimane) e ogni riga rappresenta un utente. Il mio problema è che voglio esaminare questi …

31 r data-visualization