Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Nell'odierna classe di riconoscimento dei modelli il mio professore ha parlato di PCA, autovettori ed autovalori. Ne ho capito la matematica. Se mi viene chiesto di trovare autovalori ecc. Lo farò correttamente come una macchina. Ma non l'ho capito . Non ne ho avuto lo scopo. Non ne ho avuto …
Esiste un metodo standard e accettato per selezionare il numero di layer e il numero di nodi in ciascun layer in una rete neurale feed-forward? Sono interessato ai modi automatizzati di costruire reti neurali.
La pagina di Wikipedia afferma che la probabilità e la probabilità sono concetti distinti. Nel linguaggio non tecnico, "verosimiglianza" è generalmente sinonimo di "probabilità", ma nell'uso statistico esiste una chiara distinzione in prospettiva: il numero che è la probabilità di alcuni risultati osservati dato un insieme di valori di parametro …
Disclaimer: non sono uno statistico ma un ingegnere del software. La maggior parte delle mie conoscenze in statistica proviene dall'autoeducazione, quindi ho ancora molte lacune nella comprensione dei concetti che possono sembrare banali per altre persone qui. Quindi sarei molto grato se le risposte includessero termini meno specifici e più …
Ho trovato questo confuso quando uso la cassetta degli attrezzi della rete neurale in Matlab. Ha diviso il set di dati non elaborati in tre parti: set di allenamento set di validazione set di test Noto in molti algoritmi di allenamento o di apprendimento, i dati sono spesso divisi in …
L'anno scorso ho letto un post sul blog di Brendan O'Connor intitolato "Statistiche contro apprendimento automatico, lotta!" che ha discusso alcune delle differenze tra i due campi. Andrew Gelman ha risposto favorevolmente a questo : Simon Blomberg: Dal pacchetto fortune di R: Per parafrasare in modo provocatorio, "l'apprendimento automatico è …
Nella definizione di deviazione standard, perché dobbiamo quadrare la differenza dalla media per ottenere la media (E) e riportare la radice quadrata alla fine? Non possiamo semplicemente prendere semplicemente il valore assoluto della differenza e ottenere il valore atteso (medio) di quelli, e ciò non mostrerebbe anche la variazione dei …
K-medie è un metodo ampiamente utilizzato nell'analisi dei cluster. Secondo la mia comprensione, questo metodo NON richiede NESSUNA ipotesi, ovvero forniscimi un set di dati e un numero predefinito di cluster, k, e applico solo questo algoritmo che minimizza la somma degli errori al quadrato (SSE), all'interno del cluster al …
Molte persone usano uno strumento principale come Excel o un altro foglio di calcolo, SPSS, Stata o R per le loro esigenze statistiche. Potrebbero rivolgersi a un pacchetto specifico per esigenze molto speciali, ma molte cose possono essere fatte con un semplice foglio di calcolo o un pacchetto di statistiche …
L'analisi dei componenti principali (PCA) viene di solito spiegata tramite una decomposizione degli automi della matrice di covarianza. Tuttavia, può anche essere eseguita mediante decomposizione in valori singolari (SVD) della matrice dati . Come funziona? Qual è la connessione tra questi due approcci? Qual è la relazione tra SVD e …
Questo è uno dei miei preferiti: Una voce per risposta. (Questo è nella vena della domanda Stack Overflow Qual è il tuo cartone animato preferito "programmatore"? ). PS Non collegare a caldo il fumetto senza l'autorizzazione del sito, per favore.
Recentemente ho usato il bootstrap per stimare gli intervalli di confidenza per un progetto. Qualcuno che non conosce molto sulle statistiche recentemente mi ha chiesto di spiegare perché il bootstrap funziona, ovvero perché il ricampionamento dello stesso campione più e più volte dà buoni risultati. Mi sono reso conto che, …
Supponiamo di avere un set di dati con punti. Vogliamo eseguire una regressione lineare, ma prima valori e indipendentemente l'uno dall'altro, formando un set di dati . Esiste un'interpretazione significativa della regressione sul nuovo set di dati? Questo ha un nome?n X i Y i ( X i , Y …
Qual è la differenza tra il modello Logit e Probit ? Sono più interessato qui a sapere quando usare la regressione logistica e quando usare Probit. Se c'è qualche letteratura che lo definisce usando R , anche questo sarebbe utile.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.