Un metodo generale per la creazione di soluzioni sparse è tramite stima MAP con una media zero normale prima di una varianza sconosciuta.
p(xi|σ2i)∼N(0,σ2i)
Se quindi si assegna un precedente a che ha una modalità a zero, la modalità posteriore è generalmente scarsa. Il deriva da questo approccio prendendo una distribuzione miscelazione esponenziale.σ2iL1
p(σ2i|λ)∼Expo(λ22)
Quindi ottieni
log[p(xi|λ)]=−λ|xi|+log[λ2]
Alcune alternative sono il doppio pareto generalizzato, metà cauchy, beta invertita. In un certo senso, questi sono migliori del lazo perché non riducono grandi valori. In effetti sono abbastanza sicuro che il doppio pareto generalizzato possa essere scritto come una miscela di esponenziali. Cioè scriviamo e quindi posizioniamo una gamma prima di . Noi abbiamo:λ=λip(λi|αβ)
p(xi|αβ)=α2β(1+|xi|β)−(α+1)
Nota che ho incluso costanti normalizzanti, in quanto aiutano a scegliere buoni parametri globali. Ora, se applichiamo la limitazione dell'intervallo, allora abbiamo un problema più complicato, poiché dobbiamo rinormalizzare sul simplex.
Un'altra caratteristica generica delle penalità che inducono la scarsità è che non sono differenziabili a zero. Di solito questo è perché i limiti sinistro e destro sono di segno opposto.
Questo si basa sul brillante lavoro di Nicolas Polson e James Scott sulla varianza delle rappresentazioni di miscele che usano per sviluppare TIRLS - un'estensione massiccia di minimi quadrati a una classe molto ampia di combinazioni di perdite e penalità.
In alternativa è possibile utilizzare un priore che è definito sul simplex, ma ha modalità nelle distribuzioni marginali a zero. Un esempio è la distribuzione dirichlet con tutti i parametri tra 0 e 1. La penalità implicita sarebbe simile a:
−∑i=1n−1(ai−1)log(xi)−(an−1)log(1−∑i=1n−1xi)
Dove . Tuttavia, dovresti stare attento nell'ottimizzare numericamente poiché la penalità ha delle singolarità. Un processo di stima più solido consiste nell'utilizzare la media posteriore. Anche se perdi la scarsità esatta, otterrai molti mezzi posteriori vicini a zero.p0<ai<1