Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


1
Quando fare Markov campi aleatori
Nel loro libro di testo, Modelli grafici, Famiglie esponenziali e inferenza variabile , M. Jordan e M. Wainwright discutono della connessione tra famiglie esponenziali e Markov Random Fields (modelli grafici non indirizzati). Sto cercando di capire meglio la relazione tra loro con le seguenti domande: Tutti i MRF sono membri …

2
"Intenzione dello sperimentatore" e soglie / valori p
Sto leggendo le diapositive "Doing Bayesian Data Analysis" di John Kruschke , ma in realtà ho una domanda sulla sua interpretazione dei test t e / o sull'intero framework di test di significatività dell'ipotesi nulla. Sostiene che i valori di p sono mal definiti perché dipendono dalle intenzioni dell'investigatore. In …



5
Reti neurali moderne che costruiscono la propria topologia
Una limitazione degli algoritmi di rete neurale standard (come backprop) è che devi prendere una decisione di progettazione di quanti strati nascosti e neuroni per strato vuoi. Di solito, il tasso di apprendimento e la generalizzazione sono molto sensibili a queste scelte. Questo è stato il motivo per cui gli …

5
Qual è il modo corretto per testare il significato dei risultati della classificazione
Esistono molte situazioni in cui è possibile addestrare diversi classificatori o utilizzare diversi metodi di estrazione delle funzionalità. In letteratura gli autori spesso danno l'errore di classificazione medio su una serie di divisioni casuali dei dati (cioè dopo una convalida incrociata doppiamente annidata) e talvolta danno anche varianze sull'errore rispetto …


3
Discrepanza tra regressione e ANOVA (aov vs lm in R)
Ho sempre avuto l'impressione che la regressione sia solo una forma più generale di ANOVA e che i risultati sarebbero identici. Di recente, tuttavia, ho eseguito sia una regressione che un ANOVA sugli stessi dati e i risultati differiscono in modo significativo. Cioè, nel modello di regressione sia gli effetti …
21 r  regression  anova 

1
Calcolo efficiente dell'inverso della matrice in R
Ho bisogno di calcolare l'inverso della matrice e ho usato la solvefunzione. Mentre funziona bene su piccole matrici, solvetende ad essere molto lento su grandi matrici. Mi chiedevo se ci fossero altre funzioni o combinazioni di funzioni (tramite SVD, QR, LU o altre funzioni di decomposizione) che possano darmi risultati …

4
Cosa significa "imparzialità"?
Cosa significa dire che "la varianza è uno stimatore distorto". Cosa significa convertire una stima distorta in una stima imparziale attraverso una semplice formula. Che cosa fa esattamente questa conversione? Inoltre, qual è l'uso pratico di questa conversione? Converti questi punteggi quando usi un certo tipo di statistiche?

6
Esempi di problemi di modelli Markov nascosti?
Ho letto un bel po 'di modelli Markov nascosti e sono stato in grado di codificarne una versione piuttosto semplice. Ma ci sono due modi principali che mi sembra di imparare. Uno è di leggerlo e implementarlo nel codice (che è fatto) e il secondo è capire come si applica …


3
Perché dovremmo preoccuparci della miscelazione rapida nelle catene MCMC?
Quando lavoriamo con la catena di Markov Monte Carlo per trarre l'inferenza, abbiamo bisogno di una catena che si mescoli rapidamente, cioè si muova rapidamente attraverso il supporto della distribuzione posteriore. Ma non capisco perché abbiamo bisogno di questa proprietà, perché da quello che capisco, i disegni di canditi accettati …
21 mcmc 

4
Qual è la maledizione della dimensionalità?
In particolare, sto cercando riferimenti (documenti, libri) che mostrino e spieghino rigorosamente la maledizione della dimensionalità. Questa domanda è nata dopo che ho iniziato a leggere questo white paper di Lafferty e Wasserman. Nel terzo paragrafo menzionano un'equazione "ben nota" che implica che il miglior tasso di convergenza è ; …
21 theory 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.