Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati





5
Perché è utile la Jeffreys?
Capisco che il precedente di Jeffreys è invariante sotto la parametrizzazione. Tuttavia, ciò che non capisco è il motivo per cui questa proprietà è desiderata. Perché non vorresti che il precedente cambiasse sotto un cambio di variabili?
61 bayesian  prior 


2
Rapporto di probabilità vs fattore di Bayes
Sono piuttosto evangelista per quanto riguarda l'uso dei rapporti di probabilità per rappresentare l'evidenza oggettiva a favore / contro un dato fenomeno. Tuttavia, recentemente ho appreso che il fattore Bayes svolge una funzione simile nel contesto dei metodi bayesiani (cioè il priore soggettivo è combinato con il fattore obiettivo Bayes …



5
Quale problema risolvono i metodi di contrazione?
Le festività natalizie mi hanno dato l'opportunità di rannicchiarsi vicino al fuoco con The Elements of Statistical Learning . Provenendo da una prospettiva econometrica (frequentista), ho difficoltà a cogliere gli usi dei metodi di contrazione come regressione della cresta, lazo e regressione dell'angolo minimo (LAR). In genere, sono interessato alle …

9
Come e perché funzionano la normalizzazione e il ridimensionamento delle funzionalità?
Vedo che molti algoritmi di machine learning funzionano meglio con la cancellazione media e l'equalizzazione della covarianza. Ad esempio, le reti neurali tendono a convergere più velocemente e K-Means generalmente fornisce un clustering migliore con funzionalità pre-elaborate. Non vedo l'intuizione dietro questi passaggi di pre-elaborazione che portano a prestazioni migliori. …

7
Regressione con più variabili dipendenti?
È possibile avere un'equazione di regressione (multipla) con due o più variabili dipendenti? Certo, potresti eseguire due equazioni di regressione separate, una per ciascun DV, ma non sembra che catturerebbe alcuna relazione tra i due DV?
61 regression 

6
Dove tagliare un dendrogramma?
Il clustering gerarchico può essere rappresentato da un dendrogramma. Tagliare un dendrogramma a un certo livello dà una serie di cluster. Il taglio ad un altro livello offre un altro gruppo di cluster. Come sceglieresti dove tagliare il dendrogramma? C'è qualcosa che potremmo considerare un punto ottimale? Se guardo un …

5
Qual è la relazione tra k-mean clustering e PCA?
È pratica comune applicare PCA (analisi dei componenti principali) prima di un algoritmo di clustering (come k-medie). Si ritiene che in pratica migliori i risultati del clustering (riduzione del rumore). Tuttavia, sono interessato a uno studio comparativo e approfondito della relazione tra PCA e k-medie. Ad esempio, Chris Ding e …

6
Errori standard per la previsione del lazo usando R
Sto cercando di utilizzare un modello LASSO per la previsione e devo stimare gli errori standard. Sicuramente qualcuno ha già scritto un pacchetto per farlo. Ma per quanto posso vedere, nessuno dei pacchetti su CRAN che fanno previsioni usando un LASSO restituirà errori standard per quelle previsioni. Quindi la mia …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.