Nella letteratura dell'apprendimento automatico, per rappresentare una distribuzione di probabilità, viene spesso utilizzata la funzione softmax. C'è una ragione per questo? Perché non viene utilizzata un'altra funzione?
Se e , allora posso dire cheY ∼ U ( a , X ) Y ∼ U ( a , b ) ?X∼ U( a , b )X~U(un',B)X \sim U(a, b)Y∼ U( a , X)Y~U(un',X)Y \sim U(a, X)Y∼ U( a , b ) ?Y~U(un',B)?Y \sim U(a, b)? Sto parlando di …
In fisica o meccanica matematica, partendo da una posizione basata sul tempo , si ottengono tassi di variazione tramite derivati rispetto al tempo: velocità, accelerazione, jerk (3 ° ordine), jounce (4 ° ordine).x(t)x(t)x(t) Alcuni hanno già proposto snap, crackle, pop per derivati fino al settimo ordine. I momenti, ispirati alla …
\newcommand{\P}{\mathbb{P}} Sto lanciando un dado giusto. Ogni volta che ottengo un 1, 2 o 3, scrivo un '1'; ogni volta che ottengo un 4 scrivo un '2'; ogni volta che ottengo un 5 o un 6, scrivo un '3.' Sia NNN il numero totale di lanci necessari per il prodotto …
Consenti a essere un campione di variabili casuali esponenziali iid con media e che siano le statistiche dell'ordine di questo esempio. Lascia che .X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i Definisci le distanzeSi può dimostrare che ogni è anche esponenziale, con media .Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq …
In un'impostazione binomiale, la variabile casuale, X, che indica il numero di successi viene distribuita binomialmente. La proporzione del campione può quindi essere calcolata come dove n è la dimensione del campione. Il mio libro di testo afferma cheXnXn\frac{X}{n}nnn Questa proporzione non ha una distribuzione binomiale tuttavia poiché XnXn\frac{X}{n} è …
Date due distribuzioni continue e , non mi è chiaro se la relazione di dominio convesso tra loro:FXFX\mathcal{F}_XFYFY\mathcal{F}_Y (0)FX<cFY(0)FX<cFY(0)\quad \mathcal{F}_X <_c \mathcal{F}_Y implica che (1)F−1Y(q)≤F−1X(q),∀q∈[0.5,1](1)FY−1(q)≤FX−1(q),∀q∈[0.5,1](1)\quad F_Y^{-1}(q) \leq F_X^{-1}(q),\quad \forall q\in[0.5,1] vale o se sono necessarie ulteriori ipotesi se è da tenere?(1)(1)(1) Definizione di Convesso dominante. Se due distribuzioni continue e …
Le distribuzioni stabili sono invarianti sotto le convoluzioni. Quali sotto-famiglie delle distribuzioni stabili vengono chiuse anche sotto moltiplicazione? Nel senso che se e , quindi la funzione di densità di probabilità del prodotto, (fino a una costante di normalizzazione) appartiene anche a ?f ∈ F g ∈ F f ⋅ …
Sia qualsiasi distribuzione con media definita, e deviazione standard, . Il teorema del limite centrale afferma che converge nella distribuzione in una distribuzione normale standard. Se sostituiamo con la deviazione standard del campione , esiste un teorema che afferma che converge nella distribuzione in una distribuzione t? Dal momento che …
Dopo il burn-in, possiamo usare direttamente le iterazioni MCMC per la stima della densità, ad esempio mediante la stampa di un istogramma o la stima della densità del kernel? La mia preoccupazione è che le iterazioni MCMC non siano necessariamente indipendenti, sebbene siano distribuite al massimo in modo identico. Che …
Di 'che ho il seguente modello: Poisson ( λ ) ∼ { λ1λ2se t < τse t ≥ τPoisson(λ)∼{λ1if t<τλ2if t≥τ\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases} E dai miei dati i posteriori di e mostrati di seguito. …
Pubblicare in modo incrociato la mia domanda da mathoverflow per trovare un aiuto specifico per le statistiche. Sto studiando un processo fisico che genera dati che si proiettano bene in due dimensioni con valori non negativi. Ogni processo ha una traccia (proiettata) di punti - - vedi l'immagine sotto.xxxyyy Le …
Stavo leggendo la discussione su Hacker News sull'uso della deviazione standard rispetto ad altre metriche come la deviazione assoluta media. Quindi, se dovessimo seguire il principio della massima entropia, con quale tipo di distribuzione utilizzeremmo se conoscessimo solo la media della distribuzione e la deviazione assoluta media? Oppure ha più …
Per un semplice esempio, supponiamo che ci siano due modelli di regressione lineare Modello 1 ha tre predittori, x1a, x2b, ex2c Il modello 2 ha tre predittori dal modello 1 e due predittori aggiuntivi x2aex2b Esiste un'equazione di regressione della popolazione in cui la varianza della popolazione spiegata è per …
Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1). Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale. Come posso incorporare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.