Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



2
Quanto dovremmo avere paura degli avvisi di convergenza in lme4
Se rielaboriamo un bagliore, potremmo ricevere un avviso che ci dice che il modello sta trovando difficoltà a convergere ... ad es >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) un altro modo per verificare la convergenza …

3
Cos'è la carenza di rango e come gestirla?
Il montaggio di una regressione logistica con lme4 termina con Error in mer_finalize(ans) : Downdated X'X is not positive definite. Una probabile causa di questo errore è apparentemente la carenza di rango. Cos'è la carenza di rango e come devo affrontarla?
87 r  logistic  lme4-nlme 


2
Data la potenza dei computer al giorno d'oggi, c'è mai un motivo per fare un test chi-quadrato piuttosto che il test esatto di Fisher?
Dato che al giorno d'oggi il software può eseguire il calcolo esatto del test di Fisher così facilmente , esiste qualche circostanza in cui, teoricamente o praticamente, il test chi-quadrato è effettivamente preferibile al test esatto di Fisher? I vantaggi del test esatto di Fisher includono: ridimensionamento in tabelle di …


9
Cos'è esattamente un intervallo di confidenza?
So approssimativamente e in modo informale cos'è un intervallo di confidenza. Tuttavia, non riesco a avvolgere la testa attorno a un dettaglio piuttosto importante: Secondo Wikipedia: Un intervallo di confidenza non prevede che il vero valore del parametro abbia una particolare probabilità di trovarsi nell'intervallo di confidenza dati i dati …

9
C'è una spiegazione intuitiva del perché la multicollinearità è un problema nella regressione lineare?
Il wiki discute i problemi che sorgono quando la multicollinearità è un problema di regressione lineare. Il problema di base è che la multicollinearità si traduce in stime di parametri instabili che rendono molto difficile valutare l'effetto di variabili indipendenti su variabili dipendenti. Comprendo le ragioni tecniche alla base dei …


24
Regole empiriche per statistiche "moderne"
Mi piace il libro di G van Belle sulle Regole empiriche statistiche e, in misura minore, Errori comuni in statistica (e come evitarli) di Phillip I Good e James W. Hardin. Risolvono insidie ​​comuni nell'interpretazione dei risultati di studi sperimentali e osservazionali e forniscono raccomandazioni pratiche per inferenze statistiche o …

16
In quali condizioni la correlazione implica la causalità?
Sappiamo tutti che il mantra "la correlazione non implica il nesso di causalità" è inserito in tutti gli studenti di statistica del primo anno. Ci sono alcuni begli esempi qui per illustrare l'idea. Ma a volte la correlazione non implica causalità. Il seguente esempio è tratto da questa pagina di …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.