Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


1
Rilevamento di valori anomali nelle serie temporali (LS / AO / TC) utilizzando il pacchetto tsoutliers in R. Come rappresentare i valori anomali in formato equazione?
Commenti: Prima di tutto vorrei dire un grande grazie al autore del nuovo tsoutliers pacchetto che implementa Chen e Liu di rilevazione delle serie storiche dei valori anomali che è stato pubblicato sul Journal of American Statistical Association nel 1993 in Open Source software .RRR Il pacchetto rileva 5 diversi …


1
Regressione logistica: test chi-quadro di anova vs. significatività dei coefficienti (anova () vs riepilogo () in R)
Ho un modello logistico GLM con 8 variabili. Ho eseguito un test chi-quadro in R anova(glm.model,test='Chisq')e 2 delle variabili risultano essere predittive quando vengono ordinate all'inizio del test e non tanto se ordinate nella parte inferiore. Il summary(glm.model)suggerisce che i coefficienti sono insignificanti (alto p-value). In questo caso sembra che …

8
Camminata casuale sui bordi di un cubo
Una formica viene posizionata in un angolo di un cubo e non può muoversi. Un ragno inizia dall'angolo opposto e può muoversi lungo i bordi del cubo in qualsiasi direzione con uguale probabilità . In media, di quanti passi avrà bisogno il ragno per arrivare alla formica?(x,y,z)(x,y,z)(x,y,z)1/31/31/3 (Non si tratta …

3
Come dimostrare che la funzione di base radiale è un kernel?
Come dimostrare che la funzione di base radiale k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2})è un kernel? Per quanto ho capito, per dimostrarlo dobbiamo provare uno dei seguenti: Per ogni insieme di vettori x1,x2,...,xnx1,x2,...,xnx_1, x_2, ..., x_n matrice K(x1,x2,...,xn)K(x1,x2,...,xn)K(x_1, x_2, ..., x_n) = (k(xi,xj))n×n(k(xi,xj))n×n(k(x_i, x_j))_{n \times n} è semidefinita positiva. Una mappatura ΦΦ\Phi …
35 svm  kernel-trick 


3
Contraddizione significativa nella regressione lineare: test t significativo per un coefficiente vs statistica F complessiva non significativa
Sto adattando un modello di regressione lineare multipla tra 4 variabili categoriali (con 4 livelli ciascuna) e un output numerico. Il mio set di dati ha 43 osservazioni. La regressione mi fornisce i seguenti valori dal test per ogni coefficiente di pendenza: . Pertanto, il coefficiente per il 4 ° …


3
Qual è l'errore standard residuo?
When running a multiple regression model in R, one of the outputs is a residual standard error of 0.0589 on 95,161 degrees of freedom. I know that the 95,161 degrees of freedom is given by the difference between the number of observations in my sample and the number of variables …






Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.