Statistiche e Big Data

8

Perché è così importante avere teorie di principio e matematiche per l'apprendimento automatico?

Mi chiedevo, perché è così importante avere l'apprendimento automatico di principio / teorico? Da una prospettiva personale come essere umano, posso capire perché l'apprendimento automatico basato sui principi sarebbe importante: agli umani piace capire cosa stanno facendo, troviamo bellezza e soddisfazione per la comprensione. dal punto di vista della teoria, …

25 machine-learning neural-networks conv-neural-network theory

3

Un "modello di ostacolo" è davvero un modello? O solo due modelli sequenziali separati?

Considera un modello di ostacolo che prevede i dati di conteggio yda un normale predittore x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 In questo …

25 r count-data zero-inflation

8

Le barre di errore sulle probabilità hanno qualche significato?

La gente dice spesso che alcuni eventi hanno una probabilità del 50-60% di accadere. A volte vedrò anche persone dare barre di errore esplicite sulle assegnazioni di probabilità. Queste affermazioni hanno un significato o sono solo una stranezza linguistica di disagio che sceglie un numero specifico per qualcosa che è …

25 probability error

5

Qual è la differenza tra reti neurali convoluzionali e apprendimento profondo?

Voglio usare il deep learning nel mio progetto. Ho esaminato un paio di articoli e mi è venuta una domanda: c'è qualche differenza tra la rete neurale di convoluzione e l'apprendimento profondo? Queste cose sono uguali o presentano differenze sostanziali e quale è meglio?

25 machine-learning neural-networks deep-learning terminology conv-neural-network

1

Quando i modelli misti a correlazione zero sono teoricamente validi?

La citazione di blocco riportata di seguito, dai leader nel campo della modellazione di effetti misti, afferma che coordinare i turni nei modelli con correlazione zero tra effetti casuali (modelli "ZCP") modifica le previsioni del modello. Ma qualcuno può approfondire o giustificare ulteriormente le sue affermazioni? Le dichiarazioni in questione …

25 r mixed-model lme4-nlme

4

A cosa servono le classifiche di importanza variabile?

Sono diventato in qualche modo un nichilista quando si tratta di classifiche di importanza variabile (nel contesto di modelli multivariati di ogni tipo). Spesso nel corso del mio lavoro, mi viene chiesto di aiutare un altro team a produrre una classifica di importanza variabile, o produrre una classifica di importanza …

25 multiple-regression multivariate-analysis importance

2

Stima del bias del momento della distribuzione lognormale

Sto facendo qualche esperimento numerico che consiste nel campionare una distribuzione lognormale e provo a stimare i momenti con due metodi:X∼ L N( μ , σ)X~LN(μ,σ)X\sim\mathcal{LN}(\mu, \sigma)E [ Xn]E[Xn]\mathbb{E}[X^n] Guardando la media campionaria diXnXnX^n Stimare e usando i mezzi di esempio per , e quindi usando il fatto che per …

25 estimation bias lognormal moments

0

Distribuzione Jaynes

Nel libro di Jaynes "Probability Theory: The Logic of Science" , Jaynes ha un capitolo (Cap 18) intitolato "La distribuzione e la regola della successione" in cui introduce l'idea delle distribuzioni , che questo passaggio aiuta a illustrare:A pUNpApA_pUNpApA_p [...] Per vedere questo, immagina l'effetto di ottenere nuove informazioni. Supponiamo …

25 probability bayesian beta-distribution

1

Le notizie sulla morte del test t sono state notevolmente esagerate?

Leggendo i classici di sempre di CV, mi sono imbattuto in una dichiarazione che vorrei chiarire. Questo è il post e la mia domanda si riferisce alle osservazioni conclusive: "Devo notare che tutte le conoscenze che ho appena impartito sono in qualche modo obsolete; ora che abbiamo i computer, possiamo …

25 hypothesis-testing t-test permutation-test wilcoxon-mann-whitney

5

Stima della massima verosimiglianza - perché viene utilizzato nonostante sia distorto in molti casi

La stima della massima verosimiglianza si traduce spesso in stimatori distorti (ad esempio, la sua stima per la varianza del campione è distorta per la distribuzione gaussiana). Cosa lo rende quindi così popolare? Perché esattamente è usato così tanto? Inoltre, cosa lo rende in particolare migliore rispetto all'approccio alternativo: il …

25 normal-distribution maximum-likelihood method-of-moments

1

Apprendimento in streaming all'avanguardia

Ultimamente ho lavorato con set di dati di grandi dimensioni e ho trovato molti documenti sui metodi di streaming. Per dirne alcuni: Follow-the-Regularized Leader e Mirror Descent: Equivalence Teorems and L1 Regularization ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Apprendimento in streaming: SVM One-Pass ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal stimato Sub-GrAdient SOlver per SVM …

25 machine-learning references large-data online

2

Diagnostica per modelli lineari (misti) generalizzati (in particolare residui)

Attualmente sto lottando per trovare il modello giusto per dati di conteggio difficili (variabile dipendente). Ho provato vari modelli diversi (i modelli di effetti misti sono necessari per il mio tipo di dati) come lmere lme4(con una trasformazione logaritmica) nonché modelli di effetti misti lineari generalizzati con varie famiglie come …

25 generalized-linear-model residuals negative-binomial count-data glmm

4

Visualizzazione di molte variabili in un solo diagramma

Vorrei mostrare come i valori di alcune variabili (~ 15) cambiano nel tempo, ma vorrei anche mostrare come le variabili differiscono l'una dall'altra ogni anno. Quindi ho creato questa trama: Ma anche quando si cambia la combinazione di colori o si aggiungono diversi tipi di linea / forma, questo sembra …

25 r data-visualization

3

Qual è la relazione tra ortogonale, correlazione e indipendenza?

Ho letto un articolo in cui si afferma che quando si usano contrasti pianificati per trovare mezzi diversi in un modo ANOVA, i costrutti dovrebbero essere ortogonali in modo da non essere correlati e impedire che l'errore di tipo I venga gonfiato. Non capisco perché ortogonale significherebbe non correlato in …

25 correlation independence

4

ArXiv è popolare nella comunità delle statistiche?

So che le comunità di fisica e matematica sono molto interessate ad ArXiv, ma per quanto riguarda la comunità delle statistiche? È consuetudine postare lì prima dell'invio?

25 references academia