Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati






3
Stima non distorta della matrice di covarianza per moltiplicare i dati censurati
Le analisi chimiche dei campioni ambientali sono spesso censurate di seguito ai limiti di segnalazione o ai vari limiti di rilevazione / quantificazione. Quest'ultimo può variare, generalmente in proporzione ai valori di altre variabili. Ad esempio, potrebbe essere necessario diluire un campione con un'alta concentrazione di un composto per l'analisi, …

2
Il processo di Markov dipende solo dallo stato precedente
Vorrei solo che qualcuno confermasse la mia comprensione o se mi mancasse qualcosa. La definizione di un processo markov afferma che il passaggio successivo dipende solo dallo stato corrente e non da quelli passati. Quindi, supponiamo di avere uno spazio di stato di a, b, c, d e andiamo da …



9
Come faccio a capire quale tipo di distribuzione rappresenta questi dati nei tempi di risposta del ping?
Ho provato un processo del mondo reale, i tempi di ping della rete. Il "round-trip-time" è misurato in millisecondi. I risultati sono riportati in un istogramma: I tempi di ping hanno un valore minimo, ma una lunga coda superiore. Voglio sapere che cos'è la distribuzione statistica e come stimarne i …





3
Metriche di classificazione / valutazione per dati altamente squilibrati
Mi occupo di un problema di rilevamento delle frodi (simile al credit scoring). Pertanto, esiste una relazione fortemente squilibrata tra osservazioni fraudolente e non fraudolente. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html offre un'ottima panoramica delle diverse metriche di classificazione. Precision and Recallo kappaentrambi sembrano essere una buona scelta: Un modo per giustificare i risultati di …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.