Ho un set di dati con tre variabili, in cui tutte le variabili sono quantitative. Lascialo chiamare , e . Sto adattando un modello di regressione in una prospettiva bayesiana tramite MCMC conrjags
Ho fatto un'analisi esplorativa e il grafico a dispersione di suggerisce che dovrebbe essere usato un termine quadratico. Quindi ho montato due modelli
(1)
(2)
Nel modello 1 la dimensione dell'effetto di ciascun parametro non è piccola e l'intervallo credibile al 95% non contiene il valore .
Nel modello 2 la dimensione dell'effetto dei parametri e è ridotta e ciascuno degli intervalli credibili per tutti i parametri contiene .
Il fatto che un intervallo credibile contenga è sufficiente per dire che il parametro non è significativo?
Quindi ho modificato il seguente modello
(3)
La dimensione dell'effetto di ciascun parametro non è piccola, ma ad eccezione di tutti gli intervalli credibili contengono . 0
Qual è il modo giusto per fare la selezione variabile nelle statistiche bayesiane?
EDIT: posso usare Lasso in qualsiasi modello di regressione, come il modello Beta? Sto usando un modello a dispersione variabile in cui dove è un vettore. Dovrei usare Laplace prima anche in ?δ
EDIT2: ho montato due modelli, uno con priori gaussiani per , e uno con Laplace (doppio esponenziale).δ j
Le stime per il modello gaussiano sono
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
Le stime per il modello Lazo sono
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
Le stime per e ridotte nel modello Lazo, significa che dovrei rimuovere queste variabili dal modello?δ 4
EDIT3: Il modello con doppio precedente esponenziale (Lazo) mi dà valori di Devianza, BIC e DIC più grandi rispetto al modello con priori gaussiani e ottengo anche valori più piccoli dopo aver rimosso il coefficiente di dispersione nel modello gaussiano.