Statistiche e Big Data mathematical-statistics

3

Perché la massima probabilità e la probabilità non prevista?

Perché è così comune ottenere stime della massima verosimiglianza dei parametri, ma non si sente praticamente mai delle stime dei parametri di verosimiglianza attese (cioè, basate sul valore atteso piuttosto che sulla modalità di una funzione di verosimiglianza)? Questo è principalmente per ragioni storiche o per ragioni tecniche o teoriche …

22 probability mathematical-statistics maximum-likelihood optimization expected-value

3

Avere un coniugato prima: Proprietà profonda o incidente matematico?

Alcune distribuzioni hanno priori coniugati e altre no. Questa distinzione è solo un incidente? Cioè, fai la matematica, e funziona in un modo o nell'altro, ma non ti dice davvero nulla di importante sulla distribuzione tranne il fatto stesso? O la presenza o l'assenza di un coniugato precedente riflette alcune …

21 bayesian mathematical-statistics conjugate-prior

5

Fonti per l'apprendimento (non solo per l'esecuzione) di statistiche / matematica attraverso R

Sono interessato ad esempi di fonti (codice R, pacchetti R, libri, capitoli di libri, articoli, collegamenti ecc.) Per l' apprendimento di concetti statistici e matematici attraverso R (potrebbe anche essere attraverso altre lingue, ma R è il mio sapore preferito). La sfida è che l'apprendimento del materiale si basa sulla …

21 r references mathematical-statistics

1

Quando fare Markov campi aleatori

Nel loro libro di testo, Modelli grafici, Famiglie esponenziali e inferenza variabile , M. Jordan e M. Wainwright discutono della connessione tra famiglie esponenziali e Markov Random Fields (modelli grafici non indirizzati). Sto cercando di capire meglio la relazione tra loro con le seguenti domande: Tutti i MRF sono membri …

21 mathematical-statistics graphical-model

2

Quali distribuzioni hanno soluzioni in forma chiusa per la stima della massima verosimiglianza?

Quali distribuzioni hanno soluzioni in forma chiusa per le stime della massima verosimiglianza dei parametri da un campione di osservazioni indipendenti?

21 distributions mathematical-statistics maximum-likelihood

4

Come proiettare un nuovo vettore nello spazio PCA?

Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

2

Qual è l'intuizione alla base della definizione di completezza in una statistica come impossibile da cui ricavare uno stimatore imparziale da

Nelle statistiche classiche, esiste una definizione secondo cui una statistica TTT di un insieme di dati y1,…,yny1,…,yny_1, \ldots, y_n è definita come completa per un parametro θθ\theta è impossibile formare uno stimatore imparziale di 000 da esso non banalmente. Cioè, l'unico modo per avere Eh(T(y))=0Eh(T(y))=0E h(T (y )) = 0 …

21 mathematical-statistics intuition unbiased-estimator definition complete-statistics

4

Esempio di una distribuzione discreta non negativa in cui la media (o un altro momento) non esiste?

Stavo facendo un po 'di lavoro in Scipy e mi è venuta una conversazione con un membro del gruppo scipy principale se una variabile casuale discreta non negativa può avere un momento indefinito. Penso che abbia ragione, ma non ho una prova a portata di mano. Qualcuno può mostrare / …

20 mathematical-statistics expected-value

5

Un esempio in cui il principio di verosimiglianza * conta davvero *?

Esiste un esempio in cui due diversi test difendibili con probabilità proporzionali porterebbero a inferenze marcatamente diverse (e ugualmente difendibili), per esempio, dove i valori p sono di ordine di grandezza molto distanti, ma il potere delle alternative è simile? Tutti gli esempi che vedo sono molto sciocchi, confrontando un …

20 mathematical-statistics likelihood philosophical likelihood-principle

7

Perché le matrici simmetriche positive definite (SPD) sono così importanti?

Conosco la definizione di matrice simmetrica positiva definita (SPD), ma voglio capire di più. Perché sono così importanti, intuitivamente? Ecco quello che so. Cos'altro? Per un dato dato, la matrice di varianza è SPD. La matrice di varianza è una metrica importante, vedi questo eccellente post per una spiegazione intuitiva. …

20 mathematical-statistics optimization covariance-matrix intuition linear-algebra

8

Le statistiche non sono matematica?

Le statistiche sono matematiche o no? Dato che sono tutti numeri, per lo più insegnati dai dipartimenti di matematica e ottieni crediti matematici per questo, mi chiedo se le persone lo significano solo in modo scherzoso quando lo dicono, come dire che è una parte minore della matematica o semplicemente …

20 mathematical-statistics philosophical

1

Valore atteso e varianza del registro (a)

Ho una variabile casuale X( a ) = log( Un )X(a)=log⁡(a)X(a) = \log(a) dove a è distribuito normalmente ( μ , σ 2 )N( μ , σ2)N(μ,σ2)\mathcal N(\mu,\sigma^2) . Cosa posso dire di E( X)E(X)E(X) e Va r ( X)Var(X)Var(X) ? Anche un'approssimazione sarebbe utile.

20 normal-distribution mathematical-statistics random-variable lognormal logarithm

3

Collegamento tra metrica di Fisher ed entropia relativa

Qualcuno può provare la seguente connessione tra la metrica di informazioni di Fisher e la relativa entropia (o divergenza di KL) in modo rigorosamente matematico rigoroso? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) ) =\frac{1}{2} g_{i,j} \, da^i \, da^j + (O( \|da\|^3) dove a=(a1,…,an),da=(da1,…,dan)a=(a1,…,an),da=(da1,…,dan)a=(a^1,\dots, a^n), da=(da^1,\dots,da^n) , gi,j=∫∂i(logp(x;a))∂j(logp(x;a)) p(x;a) dxgi,j=∫∂i(log⁡p(x;a))∂j(log⁡p(x;a)) …

20 mathematical-statistics kullback-leibler fisher-information

2

Calcolare quantili approssimativi per un flusso di numeri interi usando i momenti?

migrato da math.stackexchange . Sto elaborando un lungo flusso di numeri interi e sto considerando di tenere traccia di alcuni momenti per poter calcolare approssimativamente vari percentili per il flusso senza memorizzare molti dati. Qual è il modo più semplice per calcolare percentili da pochi istanti. Esiste un approccio migliore …

20 algorithms mathematical-statistics moments

2

Prova di convergenza di k-medie

Per un incarico mi è stato chiesto di fornire una prova che k-mean converge in un numero finito di passaggi. Questo è quello che ho scritto: CCCE( C) = ∑Xmini = 1K∥ x - cio∥2E(C)=ΣXminio=1K‖X-cio‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E( C)E(C)E(C) Il passaggio 2 si riferisce al passaggio che etichetta ciascun punto dati …

20 mathematical-statistics k-means

Domande taggate «mathematical-statistics»