Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Nel rispondere a questa domanda John Christie ha suggerito che l'adattamento di modelli di regressione logistica dovrebbe essere valutata attraverso la valutazione dei residui. Conosco bene come interpretare i residui in OLS, sono nella stessa scala del DV e molto chiaramente la differenza tra ye y prevista dal modello. Tuttavia, …
So empiricamente che è così. Ho appena sviluppato modelli che si imbattono in questo enigma. Ho anche il sospetto che non sia necessariamente una risposta sì / no. Voglio dire che se sia A che B sono correlati con C, ciò potrebbe avere delle implicazioni per quanto riguarda la correlazione …
È (sempre) vero che Var(∑i=1mXi)=∑i=1mVar(Xi)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?
Sto per introdurre la tabella normale standard nella mia classe di statistiche introduttive e questo mi ha fatto riflettere: chi ha creato la prima tabella normale standard? Come hanno fatto prima che arrivassero i computer? Rabbrividisco al pensiero di qualcuno che forza bruta calcolando a mano un migliaio di somme …
Capisco che il precedente di Jeffreys è invariante sotto la parametrizzazione. Tuttavia, ciò che non capisco è il motivo per cui questa proprietà è desiderata. Perché non vorresti che il precedente cambiasse sotto un cambio di variabili?
Il titolo del Comment in Nature Gli scienziati si ribellano al significato statistico inizia con: Valentin Amrhein, Sander Groenlandia, Blake McShane e oltre 800 firmatari chiedono la fine delle accuse sostenute e il licenziamento di effetti forse cruciali. e in seguito contiene dichiarazioni come: Ancora una volta, non stiamo sostenendo …
Sono piuttosto evangelista per quanto riguarda l'uso dei rapporti di probabilità per rappresentare l'evidenza oggettiva a favore / contro un dato fenomeno. Tuttavia, recentemente ho appreso che il fattore Bayes svolge una funzione simile nel contesto dei metodi bayesiani (cioè il priore soggettivo è combinato con il fattore obiettivo Bayes …
Quando si tenta di adattare i modelli a un set di dati di grandi dimensioni, il consiglio comune è quello di suddividere i dati in tre parti: formazione, convalida e set di dati di test. Questo perché i modelli di solito hanno tre "livelli" di parametri: il primo "parametro" è …
Nella letteratura sui modelli gerarchici / multilivello ho letto spesso di "modelli nidificati" e "modelli non nidificati", ma cosa significa? Qualcuno potrebbe darmi qualche esempio o parlarmi delle implicazioni matematiche di questo fraseggio?
Le festività natalizie mi hanno dato l'opportunità di rannicchiarsi vicino al fuoco con The Elements of Statistical Learning . Provenendo da una prospettiva econometrica (frequentista), ho difficoltà a cogliere gli usi dei metodi di contrazione come regressione della cresta, lazo e regressione dell'angolo minimo (LAR). In genere, sono interessato alle …
Vedo che molti algoritmi di machine learning funzionano meglio con la cancellazione media e l'equalizzazione della covarianza. Ad esempio, le reti neurali tendono a convergere più velocemente e K-Means generalmente fornisce un clustering migliore con funzionalità pre-elaborate. Non vedo l'intuizione dietro questi passaggi di pre-elaborazione che portano a prestazioni migliori. …
È possibile avere un'equazione di regressione (multipla) con due o più variabili dipendenti? Certo, potresti eseguire due equazioni di regressione separate, una per ciascun DV, ma non sembra che catturerebbe alcuna relazione tra i due DV?
Il clustering gerarchico può essere rappresentato da un dendrogramma. Tagliare un dendrogramma a un certo livello dà una serie di cluster. Il taglio ad un altro livello offre un altro gruppo di cluster. Come sceglieresti dove tagliare il dendrogramma? C'è qualcosa che potremmo considerare un punto ottimale? Se guardo un …
È pratica comune applicare PCA (analisi dei componenti principali) prima di un algoritmo di clustering (come k-medie). Si ritiene che in pratica migliori i risultati del clustering (riduzione del rumore). Tuttavia, sono interessato a uno studio comparativo e approfondito della relazione tra PCA e k-medie. Ad esempio, Chris Ding e …
Sto cercando di utilizzare un modello LASSO per la previsione e devo stimare gli errori standard. Sicuramente qualcuno ha già scritto un pacchetto per farlo. Ma per quanto posso vedere, nessuno dei pacchetti su CRAN che fanno previsioni usando un LASSO restituirà errori standard per quelle previsioni. Quindi la mia …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.