Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati




1
Perché il quasi-Poisson nella GLM non è trattato come un caso speciale di binomio negativo?
Sto cercando di adattare modelli lineari generalizzati ad alcune serie di dati di conteggio che potrebbero essere o meno sovradispersi. Le due distribuzioni canoniche che si applicano qui sono Poisson e Negative Binomial (Negbin), con EV e varianzaμμ\mu Va rP= μVun'rP=μVar_P = \mu Va rNB= μ + μ2θVun'rNB=μ+μ2θVar_{NB} = \mu …


4
Perché i dati misti sono un problema per gli algoritmi di clustering basati su euclidi?
La maggior parte degli algoritmi classici di riduzione del clustering e della dimensionalità (clustering gerarchico, analisi dei componenti principali, k-media, mappe autoorganizzanti ...) sono progettati specificamente per i dati numerici e i loro dati di input sono visti come punti in uno spazio euclideo. Questo è ovviamente un problema, dato …


3
Strane correlazioni nei risultati SVD di dati casuali; hanno una spiegazione matematica o è un bug LAPACK?
Osservo un comportamento molto strano nel risultato SVD di dati casuali, che posso riprodurre sia in Matlab che in R. Sembra un problema numerico nella libreria LAPACK; è? Traccio n=1000n=1000n=1000 campioni dal k=2k=2k=2 gaussiano dimensionale con zero covarianza di identità e media: X∼N(0,I)X∼N(0,I)X\sim \mathcal N (0, \mathbf I) . Li …


2
Nella semplice regressione lineare, da dove viene la formula per la varianza dei residui?
Secondo un testo che sto usando, la formula per la varianza del residuo è data da:ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) Trovo che questo sia difficile da credere dal momento che la residuo è la differenza tra il valore osservato e il valore stimato; se si calcolasse la varianza della …

3
Significato di "numero di parametri" in AIC
Quando si calcola AIC, AIC=2k−2lnLAIC=2k−2lnLAIC = 2k - 2 ln L k significa "numero di parametri". Ma cosa conta come parametro? Quindi ad esempio nel modello y=ax+by=ax+by = ax + b A e b sono sempre conteggiati come parametri? Cosa succede se non mi interessa il valore dell'intercetta, posso ignorarlo …
21 aic 





Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.