Perché è così comune ottenere stime della massima verosimiglianza dei parametri, ma non si sente praticamente mai delle stime dei parametri di verosimiglianza attese (cioè, basate sul valore atteso piuttosto che sulla modalità di una funzione di verosimiglianza)? Questo è principalmente per ragioni storiche o per ragioni tecniche o teoriche …
Alcune distribuzioni hanno priori coniugati e altre no. Questa distinzione è solo un incidente? Cioè, fai la matematica, e funziona in un modo o nell'altro, ma non ti dice davvero nulla di importante sulla distribuzione tranne il fatto stesso? O la presenza o l'assenza di un coniugato precedente riflette alcune …
Sono interessato ad esempi di fonti (codice R, pacchetti R, libri, capitoli di libri, articoli, collegamenti ecc.) Per l' apprendimento di concetti statistici e matematici attraverso R (potrebbe anche essere attraverso altre lingue, ma R è il mio sapore preferito). La sfida è che l'apprendimento del materiale si basa sulla …
Nel loro libro di testo, Modelli grafici, Famiglie esponenziali e inferenza variabile , M. Jordan e M. Wainwright discutono della connessione tra famiglie esponenziali e Markov Random Fields (modelli grafici non indirizzati). Sto cercando di capire meglio la relazione tra loro con le seguenti domande: Tutti i MRF sono membri …
Quali distribuzioni hanno soluzioni in forma chiusa per le stime della massima verosimiglianza dei parametri da un campione di osservazioni indipendenti?
Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …
Nelle statistiche classiche, esiste una definizione secondo cui una statistica TTT di un insieme di dati y1,…,yny1,…,yny_1, \ldots, y_n è definita come completa per un parametro θθ\theta è impossibile formare uno stimatore imparziale di 000 da esso non banalmente. Cioè, l'unico modo per avere Eh(T(y))=0Eh(T(y))=0E h(T (y )) = 0 …
Stavo facendo un po 'di lavoro in Scipy e mi è venuta una conversazione con un membro del gruppo scipy principale se una variabile casuale discreta non negativa può avere un momento indefinito. Penso che abbia ragione, ma non ho una prova a portata di mano. Qualcuno può mostrare / …
Esiste un esempio in cui due diversi test difendibili con probabilità proporzionali porterebbero a inferenze marcatamente diverse (e ugualmente difendibili), per esempio, dove i valori p sono di ordine di grandezza molto distanti, ma il potere delle alternative è simile? Tutti gli esempi che vedo sono molto sciocchi, confrontando un …
Conosco la definizione di matrice simmetrica positiva definita (SPD), ma voglio capire di più. Perché sono così importanti, intuitivamente? Ecco quello che so. Cos'altro? Per un dato dato, la matrice di varianza è SPD. La matrice di varianza è una metrica importante, vedi questo eccellente post per una spiegazione intuitiva. …
Le statistiche sono matematiche o no? Dato che sono tutti numeri, per lo più insegnati dai dipartimenti di matematica e ottieni crediti matematici per questo, mi chiedo se le persone lo significano solo in modo scherzoso quando lo dicono, come dire che è una parte minore della matematica o semplicemente …
Ho una variabile casuale X( a ) = log( Un )X(a)=log(a)X(a) = \log(a) dove a è distribuito normalmente ( μ , σ 2 )N( μ , σ2)N(μ,σ2)\mathcal N(\mu,\sigma^2) . Cosa posso dire di E( X)E(X)E(X) e Va r ( X)Var(X)Var(X) ? Anche un'approssimazione sarebbe utile.
Qualcuno può provare la seguente connessione tra la metrica di informazioni di Fisher e la relativa entropia (o divergenza di KL) in modo rigorosamente matematico rigoroso? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) ) =\frac{1}{2} g_{i,j} \, da^i \, da^j + (O( \|da\|^3) dove a=(a1,…,an),da=(da1,…,dan)a=(a1,…,an),da=(da1,…,dan)a=(a^1,\dots, a^n), da=(da^1,\dots,da^n) , gi,j=∫∂i(logp(x;a))∂j(logp(x;a)) p(x;a) dxgi,j=∫∂i(logp(x;a))∂j(logp(x;a)) …
migrato da math.stackexchange . Sto elaborando un lungo flusso di numeri interi e sto considerando di tenere traccia di alcuni momenti per poter calcolare approssimativamente vari percentili per il flusso senza memorizzare molti dati. Qual è il modo più semplice per calcolare percentili da pochi istanti. Esiste un approccio migliore …
Per un incarico mi è stato chiesto di fornire una prova che k-mean converge in un numero finito di passaggi. Questo è quello che ho scritto: CCCE( C) = ∑Xmini = 1K∥ x - cio∥2E(C)=ΣXminio=1K‖X-cio‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E( C)E(C)E(C) Il passaggio 2 si riferisce al passaggio che etichetta ciascun punto dati …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.