Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati




2
Regressione di Bayes: come si fa rispetto alla regressione standard?
Ho alcune domande sulla regressione bayesiana: Data una regressione standard come . Se voglio trasformarlo in una regressione bayesiana, ho bisogno di distribuzioni precedenti sia per che (o non funziona in questo modo)?β 0 β 1y= β0+ β1x + εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Nella regressione standard …



3
Perché la deviazione standard del campione è uno stimatore distorto di
Secondo l'articolo di Wikipedia sulla stima imparziale della deviazione standard il campione SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} è uno stimatore distorto della DS della popolazione. Indica che .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB. Le variabili casuali sono indipendenti e ognixi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) La mia domanda è duplice: Qual è …

9
È sbagliato riformulare "1 decesso su 80 è causato da un incidente d'auto" poiché "1 persona su 80 muore a causa di un incidente d'auto?"
Dichiarazione 1 (S1): "Una morte su 80 è causata da un incidente d'auto". Dichiarazione due (S2): "Una persona su 80 muore a causa di un incidente d'auto". Ora, personalmente non vedo molta differenza tra queste due affermazioni. Quando scrivo, li considererei intercambiabili con un pubblico laico. Tuttavia, ora sono stato …

7
Sfide tra industria e Kaggle. Raccogliere più osservazioni e avere accesso a più variabili è più importante della modellazione fantasia?
Spero che il titolo sia autoesplicativo. In Kaggle, la maggior parte dei vincitori usa lo stacking con a volte centinaia di modelli base, per spremere un po 'di% in più di MSE, precisione ... In generale, nella tua esperienza, quanto è importante la modellazione fantasia come lo stacking rispetto alla …



1
La regressione logistica in R ha provocato una separazione perfetta (fenomeno di Hauck-Donner). E adesso?
Sto cercando di prevedere un risultato binario usando 50 variabili esplicative continue (l'intervallo della maggior parte delle variabili va da a ∞ ). Il mio set di dati ha quasi 24.000 righe. Quando corro in R, ottengo:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically …

8
Librerie R per l'apprendimento profondo
Mi chiedevo se ci sono buone librerie R là fuori per le reti neurali di apprendimento profondo? So che c'è il nnet, neuralnete RSNNS, ma nessuno di questi sembra implementare metodi di apprendimento profondo. Sono particolarmente interessato a un apprendimento non supervisionato seguito da un apprendimento supervisionato e all'utilizzo del …


6
L '"ibrido" tra l'approccio Fisher e Neyman-Pearson ai test statistici è davvero un "miscuglio incoerente"?
Esiste una certa scuola di pensiero secondo la quale l'approccio più diffuso ai test statistici è un "ibrido" tra due approcci: quello di Fisher e quello di Neyman-Pearson; questi due approcci, afferma la rivendicazione, sono "incompatibili" e quindi il "ibrido" risultante è un "miscuglio incoerente". Fornirò una bibliografia e alcune …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.