Valore atteso di una variabile casuale gaussiana trasformata con una funzione logistica


10

Sia la funzione logistica che la deviazione standard sono generalmente indicate con . Userò e per la deviazione standard.σσ(x)=1/(1+exp(x))s

Ho un neurone logistica con un ingresso casuale la cui media e deviazione standard lo so. Spero che la differenza dalla media possa essere approssimata bene da un certo rumore gaussiano. Quindi, con un leggero abuso della notazione, supponiamo che produca . Qual è il valore atteso di ? La deviazione standard potrebbe essere grande o piccola rispetto a o . Una buona approssimazione in forma chiusa per il valore atteso sarebbe quasi buona come una soluzione in forma chiusa.μsσ(μ+N(0,s2))=σ(N(μ,s2))σ(N(μ,s2))sμ1

Non credo che esista una soluzione in forma chiusa. Questo può essere visto come una convoluzione e la funzione caratteristica per la densità logistica è nota ( ), ma non sono sicuro di quanto possa essere d'aiuto. Il calcolatore simbolico inverso non è stato in grado di riconoscere la densità a della convoluzione della densità della distribuzione logistica e una distribuzione normale standard, il che suggerisce ma non dimostra che non esiste un semplice integrale elementare. Prove più circostanziali: in alcuni articoli sull'aggiunta del rumore di input gaussiano alle reti neurali con neuroni logistici, i documenti non davano nemmeno espressioni in forma chiusa.πt csch πt0

Questa domanda è nata nel tentativo di capire l'errore nell'approssimazione del campo medio nelle macchine Boltzman.

Risposte:


5

Quello che ho usato è il seguente:

Scrivi dove . Possiamo usare un'espansione della serie Taylor.σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

Ci sono problemi di convergenza. La funzione logistica ha un polo in cui , quindi in , dispari. La divergenza non è la stessa cosa che il prefisso è inutile, ma l'approssimazione di questa serie può essere inaffidabile quando è significativo.exp(x)=1x=kπikP(|X|>μ2+π2)

Dato che , possiamo scrivere derivati ​​di come polinomi in . Ad esempio, e . I coefficienti sono correlati a OEIS A028246 .σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4


4

Quello che hai qui è una variabile casuale che segue una distribuzione logit-normale (o logistico-normale) (vedi wikipedia ), cioè . I momenti della distribuzione logit-normale non hanno soluzioni analitiche.logit[x]N(μ,s2)

Ma ovviamente è possibile ottenerli tramite l'integrazione numerica. Se usi R, c'è il pacchetto logitnorm che ha tutto ciò di cui hai bisogno. Un esempio:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

Questo produce:

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

Quindi, c'è anche una funzione di convenienza che ti darà direttamente la media e la varianza.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.