Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Funzione predict () per modelli di effetti misti lmer
Il problema: Ho letto in altri post che predictnon è disponibile per i lmermodelli di effetti misti {lme4} in [R]. Ho provato ad esplorare questo argomento con un set di dati giocattolo ... Sfondo: Il set di dati è adattato da questa fonte e disponibile come ... require(gsheet) data <- …

4
La differenza dei kernel in SVM?
Qualcuno può dirmi la differenza tra i kernel in SVM: Lineare Polinomio Gaussiano (RBF) sigmoid Perché, come sappiamo, il kernel viene utilizzato per mappare il nostro spazio di input nello spazio di funzionalità ad alta dimensionalità. E in quello spazio delle caratteristiche, troviamo il confine linearmente separabile. Quando vengono utilizzati …

3
Distribuzione di prodotti scalari di due vettori di unità casuali in dimensioni
Se e sono due vettori di unità casuali indipendenti in (distribuiti uniformemente su una sfera unitaria), qual è la distribuzione del loro prodotto scalare (prodotto punto) ?xx\mathbf{x}yy\mathbf{y}RDRD\mathbb{R}^Dx⋅yx⋅y\mathbf x \cdot \mathbf y Immagino che quando aumenta rapidamente la distribuzione (?) Diventa normale con media zero e varianza decrescente in dimensioni superiori …


4
Rilevamento di valori anomali mediante deviazioni standard
Seguendo la mia domanda qui , mi chiedo se ci sono punti di vista forti a favore o contro l'uso della deviazione standard per rilevare valori anomali (ad es. Qualsiasi punto dati che è più di 2 deviazione standard è un valore anomalo). So che questo dipende dal contesto dello …
27 outliers 


3
Lo sbiancamento è sempre buono?
Una fase di pre-elaborazione comune per gli algoritmi di apprendimento automatico è lo sbiancamento dei dati. Sembra che sia sempre bene fare lo sbiancamento poiché de-mette in correlazione i dati, rendendolo più semplice da modellare. Quando lo sbiancamento non è raccomandato? Nota: mi riferisco alla de-correlazione dei dati.


2
Stime di varianza nella validazione incrociata di k-fold
La convalida incrociata K-fold può essere utilizzata per stimare la capacità di generalizzazione di un determinato classificatore. Posso (o dovrei) anche calcolare una varianza aggregata da tutte le esecuzioni di validazione al fine di ottenere una stima migliore della sua varianza? Se no, perché? Ho trovato documenti che utilizzano la …




2
Qual è la differenza tra la varianza e l'errore quadratico medio?
Sono sorpreso che questo non sia stato chiesto prima, ma non riesco a trovare la domanda su stats.stackexchange. Questa è la formula per calcolare la varianza di un campione normalmente distribuito: ∑ ( X- X¯)2n - 1∑(X−X¯)2n−1\frac{\sum(X - \bar{X}) ^2}{n-1} Questa è la formula per calcolare l'errore quadratico medio delle …
27 variance  error 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.