Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



2
Domande pratiche sull'ottimizzazione delle foreste casuali
Le mie domande riguardano le foreste casuali. Il concetto di questo bellissimo classificatore mi è chiaro, ma ci sono ancora molte domande pratiche sull'uso. Sfortunatamente, non sono riuscito a trovare alcuna guida pratica alla RF (ho cercato qualcosa come "Una guida pratica per l'addestramento delle macchine Boltzman limitate" di Geoffrey …

4
Qual è la differenza tra una "funzione di collegamento" e una "funzione di collegamento canonico" per GLM
Qual è la differenza tra i termini "funzione di collegamento" e "funzione di collegamento canonico"? Inoltre, ci sono dei vantaggi (teorici) nell'usare l'uno rispetto all'altro? Ad esempio, una variabile di risposta binaria può essere modellata utilizzando molte funzioni di collegamento come logit , probit , ecc. Tuttavia, logit qui è …


18
Domande sulle interviste statistiche
Sto cercando alcune domande di interviste statistiche (e di probabilità, immagino), dalle più elementari alle più avanzate. Le risposte non sono necessarie (anche se i collegamenti a domande specifiche su questo sito andrebbero bene).


5
Vista unificata sulla contrazione: qual è la relazione (se presente) tra il paradosso di Stein, la regressione della cresta e gli effetti casuali nei modelli misti?
Considera i seguenti tre fenomeni. Paradosso di Stein: dati alcuni dalla distribuzione normale multivariata in , la media campionaria non è un ottimo stimatore della media vera. Si può ottenere una stima con errore quadratico medio inferiore se si riducono tutte le coordinate della media campionaria verso zero [o verso …


5
Quale funzione di perdita per compiti di classificazione multi-classe e multi-etichetta nelle reti neurali?
Sto addestrando una rete neurale per classificare un insieme di oggetti in n-classi. Ogni oggetto può appartenere a più classi contemporaneamente (multi-classe, multi-etichetta). Ho letto che per problemi multi-classe è generalmente raccomandato l'uso di softmax e entropia incrociata categorica come funzione di perdita invece di mse e capisco più o …


8
Il linguaggio R è affidabile per il settore economico?
Sono uno studente laureato in economia che si è recentemente convertito in R da altri pacchetti statistici molto noti (stavo usando principalmente SPSS). Il mio piccolo problema al momento è che sono l'unico utente R della mia classe. I miei compagni di classe usano Stata e Gauss e uno dei …



1
Come interpretare i coefficienti in una regressione di Poisson?
Come posso interpretare i principali effetti (coefficienti per il fattore codificato fittizio) in una regressione di Poisson? Supponiamo il seguente esempio: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.