Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


1
Bootstrapping vs Bayesian Bootstrapping concettualmente?
Ho difficoltà a capire cos'è un processo di bootstrap bayesiano e come ciò differirebbe dal normale bootstrap. E se qualcuno potesse offrire una revisione / confronto intuitivo / concettuale di entrambi, sarebbe fantastico. Facciamo un esempio. Supponiamo di avere un set di dati X che è [1,2,5,7,3]. Se campioniamo con …




1
Quando utilizzare i GLM binomiali Poisson vs. geometrici vs. negativi per i dati di conteggio?
Sto cercando di impaginare da solo quando è appropriato usare quale tipo di regressione (geometrico, Poisson, binomiale negativo) con i dati di conteggio, all'interno del framework GLM (solo 3 delle 8 distribuzioni GLM sono usate per i dati di conteggio, sebbene la maggior parte di ciò che Ho letto i …

2
Tecniche di aumento dei dati per set di dati generali?
In molte applicazioni di apprendimento automatico, i cosiddetti metodi di aumento dei dati hanno permesso di costruire modelli migliori. Ad esempio, supponi un set di addestramento di immagini di cani e gatti. Ruotando, specchiando, regolando il contrasto, ecc. È possibile generare immagini aggiuntive da quelle originali.100100100 Nel caso delle immagini, …



2
Perché la normalità dei residui è "a malapena importante" ai fini della stima della linea di regressione?
Gelman and Hill (2006) scrivono a p46 che: L'ipotesi di regressione che è generalmente meno importante è che gli errori siano normalmente distribuiti. In effetti, allo scopo di stimare la linea di regressione (rispetto alla previsione dei singoli punti dati), l'assunzione della normalità è a malapena importante. Pertanto, contrariamente a …



3
Distribuzione del più grande frammento di un bastone rotto (spaziature)
Lascia che un bastoncino di lunghezza 1 sia rotto in frammenti uniformemente a caso. Qual è la distribuzione della lunghezza del frammento più lungo?k+1k+1k+1 Più formalmente, let sia IID e let siano le statistiche dell'ordine associate, ovvero ordiniamo semplicemente l'esempio in modo tale che . Lascia che .(U1,…Uk)(U1,…Uk)(U_1, \ldots U_k)U(0,1)U(0,1)U(0,1)(U(1),…,U(k))(U(1),…,U(k))(U_{(1)}, …

1
interpretazione delle stime della regressione logistica cloglog
Qualcuno potrebbe consigliarmi su come interpretare le stime da una regressione logistica utilizzando un collegamento cloglog? Ho inserito il seguente modello in lme4: glm(cbind(dead, live) ~ time + factor(temp) * biomass, data=mussel, family=binomial(link=cloglog)) Ad esempio, la stima del tempo è 0,015. È corretto dire che le probabilità di mortalità per …

3
Dalla regola Perceptron alla Discesa del gradiente: in che modo Perceptrons con una funzione di attivazione sigmoidea differisce dalla regressione logistica?
In sostanza, la mia domanda è che nei Perceptron multistrato, i percettroni sono usati con una funzione di attivazione sigmoidea. In modo che nella regola di aggiornamento sia calcolato comey^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} In che modo questo "sigmoide" Perceptron differisce quindi da una regressione logistica? Direi che un percettrone sigmoideo …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.