Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

15
Perché le statistiche parametriche sarebbero mai state preferite rispetto alle non parametriche?
Qualcuno può spiegarmi perché qualcuno dovrebbe scegliere un parametro parametrico piuttosto che un metodo statistico non parametrico per test di ipotesi o analisi di regressione? Nella mia mente, è come andare per il rafting e la scelta di un orologio resistente non l'acqua, perché si potrebbe non bagnarlo. Perché non …


4
Perché includere latitudine e longitudine in un account GAM per l'autocorrelazione spaziale?
Ho prodotto modelli di additivi generalizzati per la deforestazione. Per tenere conto dell'autocorrelazione spaziale, ho incluso latitudine e longitudine come termine di interazione smussato (es. S (x, y)). Ho basato questo sulla lettura di molti articoli in cui gli autori affermano che "per tenere conto dell'autocorrelazione spaziale, le coordinate dei …



8
Come posso aiutare a garantire che i dati dei test non finiscano nei dati di addestramento?
Supponiamo di avere qualcuno che sta costruendo un modello predittivo, ma che qualcuno non sia necessariamente esperto di principi statistici o di apprendimento automatico adeguati. Forse stiamo aiutando quella persona mentre stanno imparando, o forse quella persona sta usando una sorta di pacchetto software che richiede una conoscenza minima da …



2
Qual è la differenza tra lo sbiancamento ZCA e lo sbiancamento PCA?
Sono confuso circa lo sbiancamento ZCA e lo sbiancamento normale (che si ottiene dividendo i componenti principali per le radici quadrate degli autovalori PCA). Per quanto ne so, xZCAwhite=UxPCAwhite,xZCAwhite=UxPCAwhite,\mathbf x_\mathrm{ZCAwhite} = \mathbf U \mathbf x_\mathrm{PCAwhite}, dove sono autovettori PCA.UU\mathbf U Quali sono gli usi dello sbiancamento ZCA? Quali sono le …

3
Perché la stima della cresta diventa migliore dell'OLS aggiungendo una costante alla diagonale?
Comprendo che la stima della regressione della cresta è il ββ\beta che minimizza la somma residua del quadrato e una penalità sulla dimensione di ββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin⁡[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[ \text{RSS} + \lambda \|\beta\|^2_2\big] Tuttavia, non capisco appieno il significato del fatto che differisce da aggiungendo solo …






Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.