Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

8
Perché è così importante avere teorie di principio e matematiche per l'apprendimento automatico?
Mi chiedevo, perché è così importante avere l'apprendimento automatico di principio / teorico? Da una prospettiva personale come essere umano, posso capire perché l'apprendimento automatico basato sui principi sarebbe importante: agli umani piace capire cosa stanno facendo, troviamo bellezza e soddisfazione per la comprensione. dal punto di vista della teoria, …


8
Le barre di errore sulle probabilità hanno qualche significato?
La gente dice spesso che alcuni eventi hanno una probabilità del 50-60% di accadere. A volte vedrò anche persone dare barre di errore esplicite sulle assegnazioni di probabilità. Queste affermazioni hanno un significato o sono solo una stranezza linguistica di disagio che sceglie un numero specifico per qualcosa che è …


1
Quando i modelli misti a correlazione zero sono teoricamente validi?
La citazione di blocco riportata di seguito, dai leader nel campo della modellazione di effetti misti, afferma che coordinare i turni nei modelli con correlazione zero tra effetti casuali (modelli "ZCP") modifica le previsioni del modello. Ma qualcuno può approfondire o giustificare ulteriormente le sue affermazioni? Le dichiarazioni in questione …


2
Stima del bias del momento della distribuzione lognormale
Sto facendo qualche esperimento numerico che consiste nel campionare una distribuzione lognormale e provo a stimare i momenti con due metodi:X∼ L N( μ , σ)X~LN(μ,σ)X\sim\mathcal{LN}(\mu, \sigma)E [ Xn]E[Xn]\mathbb{E}[X^n] Guardando la media campionaria diXnXnX^n Stimare e usando i mezzi di esempio per , e quindi usando il fatto che per …

0
Distribuzione Jaynes
Nel libro di Jaynes "Probability Theory: The Logic of Science" , Jaynes ha un capitolo (Cap 18) intitolato "La distribuzione e la regola della successione" in cui introduce l'idea delle distribuzioni , che questo passaggio aiuta a illustrare:A pUNpApA_pUNpApA_p [...] Per vedere questo, immagina l'effetto di ottenere nuove informazioni. Supponiamo …


5
Stima della massima verosimiglianza - perché viene utilizzato nonostante sia distorto in molti casi
La stima della massima verosimiglianza si traduce spesso in stimatori distorti (ad esempio, la sua stima per la varianza del campione è distorta per la distribuzione gaussiana). Cosa lo rende quindi così popolare? Perché esattamente è usato così tanto? Inoltre, cosa lo rende in particolare migliore rispetto all'approccio alternativo: il …

1
Apprendimento in streaming all'avanguardia
Ultimamente ho lavorato con set di dati di grandi dimensioni e ho trovato molti documenti sui metodi di streaming. Per dirne alcuni: Follow-the-Regularized Leader e Mirror Descent: Equivalence Teorems and L1 Regularization ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Apprendimento in streaming: SVM One-Pass ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal stimato Sub-GrAdient SOlver per SVM …

2
Diagnostica per modelli lineari (misti) generalizzati (in particolare residui)
Attualmente sto lottando per trovare il modello giusto per dati di conteggio difficili (variabile dipendente). Ho provato vari modelli diversi (i modelli di effetti misti sono necessari per il mio tipo di dati) come lmere lme4(con una trasformazione logaritmica) nonché modelli di effetti misti lineari generalizzati con varie famiglie come …

4
Visualizzazione di molte variabili in un solo diagramma
Vorrei mostrare come i valori di alcune variabili (~ 15) cambiano nel tempo, ma vorrei anche mostrare come le variabili differiscono l'una dall'altra ogni anno. Quindi ho creato questa trama: Ma anche quando si cambia la combinazione di colori o si aggiungono diversi tipi di linea / forma, questo sembra …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.