Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati




3
È possibile modificare un'ipotesi per abbinare i dati osservati (ovvero la spedizione di pesca) ed evitare un aumento degli errori di tipo I?
È noto che i ricercatori dovrebbero dedicare del tempo all'osservazione e all'esplorazione di dati e ricerche esistenti prima di formulare un'ipotesi e quindi raccogliere dati per verificare tale ipotesi (facendo riferimento al test di significatività dell'ipotesi nulla). Molti libri statistici di base avvertono che le ipotesi devono essere formate a …

6
Quale sarebbe un solido modello bayesiano per stimare la scala di una distribuzione approssimativamente normale?
Esistono numerosi stimatori di scala robusti . Un esempio notevole è la deviazione assoluta mediana che si riferisce alla deviazione standard come . In un quadro bayesiano esistono numerosi modi per stimare in modo robusto la posizione di una distribuzione approssimativamente normale (diciamo una Normale contaminata da valori anomali), ad …




7
Esistono algoritmi per calcolare i parametri di regressione lineare o logistica "in esecuzione"?
Un documento "Calcolo accurato della varianza corrente" all'indirizzo http://www.johndcook.com/standard_deviation.html mostra come calcolare media corrente, varianza e deviazioni standard. Esistono algoritmi in cui i parametri di un modello di regressione lineare o logistica possono essere similmente aggiornati "dinamicamente" man mano che viene fornito ogni nuovo record di addestramento?

4
ANOVA su dati binomiali
Sto analizzando un set di dati sperimentali. I dati sono costituiti da un vettore associato del tipo di trattamento e da un risultato binomiale: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... Nella colonna dei risultati, 1 indica un successo e 0 indica un errore. …



12
Qual è il concetto statistico più difficile da comprendere?
Questa è una domanda simile a quella qui , ma abbastanza diversa penso che valga la pena chiedere. Pensavo di iniziare, quello che penso sia uno dei più difficili da capire. Il mio è la differenza tra probabilità e frequenza . Uno è al livello di "conoscenza della realtà" (probabilità), …
32 teaching 


5
Modellazione di dati longitudinali in cui l'effetto del tempo varia nella forma funzionale tra gli individui
Contesto : Immagina di avere uno studio longitudinale che ha misurato una variabile dipendente (DV) una volta alla settimana per 20 settimane su 200 partecipanti. Anche se sono interessato in generale, i DV tipici che sto pensando di includere comprendono le prestazioni lavorative dopo l'assunzione o varie misure di benessere …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.