Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Di recente ho appreso il metodo di Fisher per combinare i valori p. Questo si basa sul fatto che il valore p sotto il null segue una distribuzione uniforme e che che penso sia geniale. Ma la mia domanda è: perché andare in questo modo contorto? e perché no (cosa …
La statistica Kappa ( ) fu introdotta nel 1960 da Cohen [1] per misurare l'accordo tra due rater. La sua varianza, tuttavia, era stata fonte di contraddizioni per un bel po 'di tempo.κκ\kappa La mia domanda è su quale sia il miglior calcolo della varianza da utilizzare con campioni di …
Se l'interesse sta semplicemente stimando i parametri di un modello (stima puntuale e / o intervallo) e le informazioni precedenti non sono affidabili, deboli (so che questo è un po 'vago ma sto cercando di stabilire uno scenario in cui la scelta di un la priorità è difficile) ... Perché …
Trovo difficile capire quale sia realmente il problema con più confronti . Con una semplice analogia, si dice che una persona che prenderà molte decisioni farà molti errori. Si applicano quindi precauzioni molto conservative, come la correzione di Bonferroni, in modo da rendere probabile che questa persona commetta qualsiasi errore, …
Mi chiedevo se esiste un modello statistico "cheat sheet (s)" che elenca una o più informazioni: quando usare il modello quando non usare il modello input richiesti e opzionali uscite attese il modello è stato testato in diversi settori (politica, bio, ingegneria, produzione, ecc.)? è accettato nella pratica o nella …
Le persone spesso parlano di come gestire i valori anomali nelle statistiche. La cosa che mi preoccupa di questo è che, per quanto ne so, la definizione di un outlier è completamente soggettiva. Ad esempio, se la vera distribuzione di una variabile casuale è molto pesante o bimodale, qualsiasi visualizzazione …
Nelle statistiche tradizionali, durante la creazione di un modello, controlliamo la multicollinearità utilizzando metodi come le stime del fattore di inflazione della varianza (VIF), ma nell'apprendimento automatico, invece, utilizziamo la regolarizzazione per la selezione delle funzionalità e non sembriamo verificare se le funzionalità sono correlate affatto. Perché lo facciamo?
Sto creando GLM di Poisson in R. Per verificare la sovradispersione, sto esaminando il rapporto tra devianza residua e gradi di libertà forniti da summary(model.name). Esiste un valore di interruzione o un test per questo rapporto da considerare "significativo?" So che se è> 1 i dati sono sovradispersi, ma se …
Ho due serie storiche, mostrate nella trama qui sotto: La trama mostra tutti i dettagli di entrambe le serie storiche, ma se necessario posso facilmente ridurla alle osservazioni coincidenti. La mia domanda è: quali metodi statistici posso usare per valutare le differenze tra le serie storiche? So che questa è …
Sto cercando di etichettare un diagramma a dispersione piuttosto semplice in R. Questo è quello che uso: plot(SI, TI) text(SI, TI, Name, pos=4, cex=0.7) Il risultato è mediocre, come puoi vedere (clicca per ingrandire): Ho provato a compensare questo usando la textxyfunzione, ma non è meglio . Allargare l'immagine stessa …
Mentre la scelta delle funzioni di attivazione per il livello nascosto è abbastanza chiara (principalmente sigma o tanh), mi chiedo come decidere la funzione di attivazione per il livello di output. Le scelte comuni sono funzioni lineari, funzioni sigmoidi e funzioni softmax. Tuttavia, quando dovrei usare quale?
Questo sembra essere un problema di base, ma mi sono appena reso conto che in realtà non so come testare l'uguaglianza dei coefficienti da due diverse regressioni. Qualcuno può far luce su questo? Più formalmente, supponiamo di aver eseguito le due regressioni seguenti: e dove riferisce alla matrice di progettazione …
Ho trovato questo tutorial , che suggerisce che è necessario eseguire la funzione di ridimensionamento sulle funzionalità prima del clustering (credo che converta i dati in z-score). Mi chiedo se sia necessario. Lo sto chiedendo principalmente perché c'è un bel punto a gomito quando non ridimensiono i dati, ma scompare …
Voglio sapere quali sono le differenze tra l' algoritmo avanti-indietro e l' algoritmo di Viterbi per l'inferenza nei modelli nascosti di Markov (HMM).
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.