Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sto lavorando con un gran numero di serie storiche. Queste serie temporali sono essenzialmente misurazioni di rete che arrivano ogni 10 minuti e alcune sono periodiche (ovvero la larghezza di banda), mentre altre no (ovvero la quantità di traffico di routing). Vorrei un semplice algoritmo per eseguire un "rilevamento anomalo" …
Non sono uno statistico per educazione, sono un ingegnere del software. Eppure le statistiche arrivano molto. In effetti, domande specifiche sull'errore di tipo I e di tipo II stanno sorgendo molto nel corso dei miei studi per l'esame Associate Software Development Development Associate (matematica e statistica sono il 10% dell'esame). …
Se rielaboriamo un bagliore, potremmo ricevere un avviso che ci dice che il modello sta trovando difficoltà a convergere ... ad es >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) un altro modo per verificare la convergenza …
Il montaggio di una regressione logistica con lme4 termina con Error in mer_finalize(ans) : Downdated X'X is not positive definite. Una probabile causa di questo errore è apparentemente la carenza di rango. Cos'è la carenza di rango e come devo affrontarla?
So che k-mean non è supervisionato e viene utilizzato per il clustering ecc. E che k-NN è supervisionato. Ma volevo sapere differenze concrete tra i due?
Dato che al giorno d'oggi il software può eseguire il calcolo esatto del test di Fisher così facilmente , esiste qualche circostanza in cui, teoricamente o praticamente, il test chi-quadrato è effettivamente preferibile al test esatto di Fisher? I vantaggi del test esatto di Fisher includono: ridimensionamento in tabelle di …
Supponiamo di avere una serie di dati di esempio da una distribuzione sconosciuta o complessa e di voler fare qualche deduzione su una statistica dei dati. La mia inclinazione predefinito è quello di generare solo un mucchio di campioni di bootstrap con sostituzione, e calcolare la mia statistica su ciascun …
So approssimativamente e in modo informale cos'è un intervallo di confidenza. Tuttavia, non riesco a avvolgere la testa attorno a un dettaglio piuttosto importante: Secondo Wikipedia: Un intervallo di confidenza non prevede che il vero valore del parametro abbia una particolare probabilità di trovarsi nell'intervallo di confidenza dati i dati …
Il wiki discute i problemi che sorgono quando la multicollinearità è un problema di regressione lineare. Il problema di base è che la multicollinearità si traduce in stime di parametri instabili che rendono molto difficile valutare l'effetto di variabili indipendenti su variabili dipendenti. Comprendo le ragioni tecniche alla base dei …
È mai valido includere un'interazione bidirezionale in un modello senza includere gli effetti principali? Che cosa succede se la tua ipotesi riguarda solo l'interazione, devi ancora includere gli effetti principali?
Mi piace il libro di G van Belle sulle Regole empiriche statistiche e, in misura minore, Errori comuni in statistica (e come evitarli) di Phillip I Good e James W. Hardin. Risolvono insidie comuni nell'interpretazione dei risultati di studi sperimentali e osservazionali e forniscono raccomandazioni pratiche per inferenze statistiche o …
Sappiamo tutti che il mantra "la correlazione non implica il nesso di causalità" è inserito in tutti gli studenti di statistica del primo anno. Ci sono alcuni begli esempi qui per illustrare l'idea. Ma a volte la correlazione non implica causalità. Il seguente esempio è tratto da questa pagina di …
Ho adattare alcuni modelli effetti misti (in particolare modelli longitudinali) utilizzando lme4in Rma vorrei padroneggiare davvero i modelli e il codice che va con loro. Tuttavia, prima di immergermi con entrambi i piedi (e acquistare alcuni libri) voglio essere sicuro di imparare la biblioteca giusta. Ho usato lme4fino ad ora …
È noto che la mediana è resistente ai valori anomali. In tal caso, quando e perché dovremmo usare la media in primo luogo? Una cosa che mi viene in mente forse è capire la presenza di valori anomali, ovvero se la mediana è lontana dalla media, la distribuzione è distorta …
Sono nuovo di machine learning e ho cercato di capire come applicare la rete neurale alla previsione di serie storiche. Ho trovato risorse relative alla mia query, ma mi sembra di essere ancora un po 'perso. Penso che una spiegazione di base senza troppi dettagli sarebbe di aiuto. Diciamo che …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.