Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho una CNN a quattro strati per prevedere la risposta al cancro usando i dati della risonanza magnetica. Uso le attivazioni ReLU per introdurre non linearità. L'accuratezza e la perdita del treno aumentano e diminuiscono monotonicamente rispettivamente. Ma la precisione del mio test inizia a fluttuare selvaggiamente. Ho provato a …
Di recente mi sono imbattuto in un documento che propone di utilizzare un classificatore k-NN su un set di dati specifico. Gli autori hanno utilizzato tutti i campioni di dati disponibili per eseguire la convalida incrociata k-fold per diversi valori k e riportare i risultati della convalida incrociata della migliore …
Sono molto nuovo nelle statistiche bayesiane e questa potrebbe essere una domanda sciocca. Tuttavia: Considera un intervallo credibile con un precedente che specifica una distribuzione uniforme. Ad esempio, da 0 a 1, dove 0 a 1 rappresenta l'intero intervallo di possibili valori di un effetto. In questo caso, un intervallo …
Stavo cercando di imparare l'apprendimento automatico usando il materiale Coursera . In questa lezione, Andrew Ng utilizza l'algoritmo di discesa gradiente per trovare i coefficienti del modello di regressione lineare che minimizzerà la funzione di errore (funzione di costo). Per la regressione lineare, abbiamo bisogno di una discesa gradiente? Sembra …
Ho visto l'altro thread qui, ma non credo che la risposta abbia soddisfatto la vera domanda. Quello che ho letto continuamente è che Naive Bayes è un classificatore lineare (es: qui ) (tale da tracciare un confine di decisione lineare) usando la dimostrazione delle probabilità del log. Tuttavia, ho simulato …
Nelle note del MIT OpenCourseWare per la 18.05 Introduzione a Probabilità e statistiche, primavera 2014 (attualmente disponibile qui ), si afferma: Il metodo percentile bootstrap è attraente per la sua semplicità. Tuttavia dipende dalla distribuzione bootstrap di base al fatto che un particolare campione rappresenta una buona approssimazione alla vera …
Guardando le definizioni di Wikipedia di: Errore al quadrato medio (MSE) Somma dei quadrati residua (RSS) Mi sembra quello MSE = 1NRSS = 1N∑ ( fio- yio)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 dove NNN è colui numero di campioni e fiofif_i è la nostra stima yioyiy_i . …
Sull'esistenza di un termine di errore nella regressione logistica (e nella sua presunta distribuzione), ho letto in vari punti che: non esiste alcun termine di errore il termine di errore ha una distribuzione binomiale (in conformità con la distribuzione della variabile di risposta) il termine di errore ha una distribuzione …
Vorrei determinare l'importanza relativa degli insiemi di variabili verso un randomForestmodello di classificazione in R. La importancefunzione fornisce la MeanDecreaseGinimetrica per ogni singolo predittore - è semplice come sommare questo attraverso ciascun predittore in un insieme? Per esempio: # Assumes df has variables a1, a2, b1, b2, and outcome rf …
Si afferma spesso che il bootstrap può fornire una stima della distorsione in uno stimatore. Se t è la stima per qualche statistica, e ~ t i sono le repliche bootstrap (con i ∈ { 1 , ⋯ , N } ), allora la stima bootstrap di polarizzazione è che …
Sto usando lo strumento libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) per la classificazione dei vettori di supporto. Tuttavia, sono confuso sul formato dei dati di input. Dal README: Il formato del file di dati di addestramento e test è: <label> <index1>:<value1> <index2>:<value2> ... . . . Ogni riga contiene un'istanza ed è …
È possibile calcolare i valori AIC o BIC per i modelli di regressione del lazo e altri modelli regolarizzati in cui i parametri entrano solo parzialmente nell'equazione. Come si determinano i gradi di libertà? Sto usando R per adattare i modelli di regressione del lazo con la glmnet()funzione del glmnetpacchetto …
Diciamo che ho 1000 componenti e ho raccolto dati su quante volte questi registrano un errore e ogni volta che hanno registrato un errore, tengo anche traccia del tempo impiegato dal mio team per risolvere il problema. In breve, ho registrato il tempo di riparazione (in secondi) per ciascuno di …
Questo si presenta come una domanda simile e non ha ottenuto molte risposte. Omettendo test come Cook's D e osservando i residui come gruppo, sono interessato a come gli altri usano i residui quando valutano la bontà di adattamento. Uso i residui grezzi: in un diagramma QQ, per valutare la …
Sto cercando di rappresentare graficamente il numero di azioni degli utenti (in questo caso "Mi piace") nel tempo. Quindi ho "Numero di azioni" come il mio asse y, il mio asse x è il tempo (settimane) e ogni riga rappresenta un utente. Il mio problema è che voglio esaminare questi …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.