Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Perché le persone usano tecniche di programmazione quadratica (come SMO) quando hanno a che fare con SVM con kernel? Cosa c'è di sbagliato nella discesa del gradiente? È impossibile da usare con i kernel o è troppo lento (e perché?). Ecco un po 'più di contesto: cercando di capire un …
Ho difficoltà a capire cos'è un processo di bootstrap bayesiano e come ciò differirebbe dal normale bootstrap. E se qualcuno potesse offrire una revisione / confronto intuitivo / concettuale di entrambi, sarebbe fantastico. Facciamo un esempio. Supponiamo di avere un set di dati X che è [1,2,5,7,3]. Se campioniamo con …
Stavo leggendo il rapporto sulla soluzione vincente di una competizione Kaggle ( Classificazione malware ). Il rapporto può essere trovato in questo post del forum . Il problema era un problema di classificazione (nove classi, la metrica era la perdita logaritmica) con 10000 elementi nel set di treni, 10000 elementi …
Per semplicità, supponiamo di lavorare sul classico esempio di e-mail spam / non spam. Ho un set di 20000 e-mail. Di questi, so che 2000 sono spam ma non ho alcun esempio di e-mail non spam. Vorrei prevedere se i restanti 18000 sono spam o meno. Idealmente, il risultato che …
Voglio modellare una regressione logistica con dati sbilanciati (9: 1). Volevo provare l'opzione pesi nella glmfunzione in R, ma non sono sicuro al 100% di ciò che fa. Diciamo che la mia variabile di output è c(0,0,0,0,0,0,0,0,0,1). ora voglio dare l '"1" 10 volte più peso. quindi do l'argomento pesi …
Sto cercando di impaginare da solo quando è appropriato usare quale tipo di regressione (geometrico, Poisson, binomiale negativo) con i dati di conteggio, all'interno del framework GLM (solo 3 delle 8 distribuzioni GLM sono usate per i dati di conteggio, sebbene la maggior parte di ciò che Ho letto i …
In molte applicazioni di apprendimento automatico, i cosiddetti metodi di aumento dei dati hanno permesso di costruire modelli migliori. Ad esempio, supponi un set di addestramento di immagini di cani e gatti. Ruotando, specchiando, regolando il contrasto, ecc. È possibile generare immagini aggiuntive da quelle originali.100100100 Nel caso delle immagini, …
Supponiamo che stia provando a stimare un gran numero di parametri da alcuni dati ad alta dimensione, usando una sorta di stime regolarizzate. Il regolarizzatore introduce un certo pregiudizio nelle stime, ma può ancora essere un buon compromesso perché la riduzione della varianza dovrebbe più che compensare. Il problema si …
Preambolo Questo è un post lungo. Se rileggi questo, tieni presente che ho modificato la parte della domanda, sebbene il materiale di sfondo rimanga lo stesso. Inoltre, credo di aver escogitato una soluzione al problema. Quella soluzione appare in fondo al post. Grazie a CliffAB per aver sottolineato che la …
Gelman and Hill (2006) scrivono a p46 che: L'ipotesi di regressione che è generalmente meno importante è che gli errori siano normalmente distribuiti. In effetti, allo scopo di stimare la linea di regressione (rispetto alla previsione dei singoli punti dati), l'assunzione della normalità è a malapena importante. Pertanto, contrariamente a …
Questa distribuzione discreta ha un nome? Peri ∈ 1 ... Nio∈1 ...Ni \in 1...N f( i ) = 1NΣNj = i1jf(io)=1NΣj=ioN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} Mi sono imbattuto in questa distribuzione da quanto segue: ho un elenco di elementi classificati in base a una funzione di utilità. Voglio …
Di recente, ho incontrato diversi documenti e risorse online che menzionano la causalità di Granger . Una breve navigazione nel corrispondente articolo di Wikipedia mi ha lasciato l'impressione che questo termine si riferisca alla causalità nel contesto di serie temporali (o, più in generale, processi stocastici ). Inoltre, leggere questo …
Lascia che un bastoncino di lunghezza 1 sia rotto in frammenti uniformemente a caso. Qual è la distribuzione della lunghezza del frammento più lungo?k+1k+1k+1 Più formalmente, let sia IID e let siano le statistiche dell'ordine associate, ovvero ordiniamo semplicemente l'esempio in modo tale che . Lascia che .(U1,…Uk)(U1,…Uk)(U_1, \ldots U_k)U(0,1)U(0,1)U(0,1)(U(1),…,U(k))(U(1),…,U(k))(U_{(1)}, …
Qualcuno potrebbe consigliarmi su come interpretare le stime da una regressione logistica utilizzando un collegamento cloglog? Ho inserito il seguente modello in lme4: glm(cbind(dead, live) ~ time + factor(temp) * biomass, data=mussel, family=binomial(link=cloglog)) Ad esempio, la stima del tempo è 0,015. È corretto dire che le probabilità di mortalità per …
In sostanza, la mia domanda è che nei Perceptron multistrato, i percettroni sono usati con una funzione di attivazione sigmoidea. In modo che nella regola di aggiornamento sia calcolato comey^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} In che modo questo "sigmoide" Perceptron differisce quindi da una regressione logistica? Direi che un percettrone sigmoideo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.