La "teoria del campionamento" ti dirà che non esiste tale stima. Ma puoi ottenerne uno, devi solo essere ragionevole riguardo alle tue informazioni precedenti e fare un lavoro matematico molto più difficile.
Se hai specificato un metodo di stima bayesiano e il posteriore è lo stesso del precedente, allora puoi dire che i dati non dicono nulla sul parametro. Poiché le cose possono diventare "singolari" su di noi, non possiamo usare spazi di parametri infiniti. Suppongo che, poiché usi la correlazione di Pearson, hai una probabilità normale bivariata:
Qi=(xi-μx)2
p ( D | μX, μy, σX, σy, ρ ) = ( σXσy2 π( 1 - ρ2)--------√)- Ne x p ( - ∑ioQio2 ( 1 - ρ2))
dove
Qio= ( xio- μX)2σ2X+ ( yio- μy)2σ2y- 2 ρ ( xio- μX) ( yio- μy)σXσy
Ora per indicare che un set di dati può avere lo stesso valore, scrivi , e quindi otteniamo:yio= y
s2x=1
ΣioQio= N[ ( y- μy)2σ2y+ s2X+ ( x¯¯¯- μX)2σ2X- 2 ρ ( x¯¯¯- μX) ( y- μy)σXσy]
dove
S2X= 1NΣio( xio- x¯¯¯)2
E così la probabilità dipende da quattro numeri, . Quindi vuoi una stima di , quindi devi moltiplicare per un precedente e integrare i parametri di disturbo . Adesso per prepararci all'integrazione, "completiamo il quadrato"
S2X, y, x¯¯¯, NρμX, μy, σX, σy
ΣioQio1 - ρ2= N⎡⎣⎢⎢( μy- [ y- ( x¯¯¯- μX) ρ σyσX] )2σ2y( 1 - ρ2)+ s2Xσ2X( 1 - ρ2)+ ( x¯¯¯- μX)2σ2X⎤⎦⎥⎥
Ora dovremmo sbagliare sul versante della cautela e garantire una probabilità adeguatamente normalizzata. In questo modo non possiamo metterci nei guai. Una di queste opzioni consiste nell'utilizzare un precedente debolmente informativo, che pone delle restrizioni sull'intervallo di ciascuno. Quindi abbiamo per i mezzi con flat precedente e per le deviazioni standard con jeffreys precedente. Questi limiti sono facili da stabilire con un po 'di "buon senso" pensando al problema. Prenderò un precedente non specificato per , e quindi otteniamo (l'uniforme dovrebbe funzionare bene, se non troncare la singolarità a ):Lμ< μX, μy< UμLσ< σX, σy< Uσρ± 1
p ( ρ , μX, μy, σX, σy) = p ( ρ )A σXσy
Dove . Questo dà un posteriore di:A = 2 ( Uμ- Lμ)2[ l o g( Uσ) - l o g( Lσ) ]2
p ( ρ | D ) = ∫p ( ρ , μX, μy, σX, σy) p ( D | μX,μy,σX,σy, ρ ) dμydμXdσXdσy
=p(ρ)A[2π(1−ρ2)]N2∫UσLσ∫UσLσ(σxσy)−N−1exp(−Ns2x2σ2x(1−ρ2))×
∫UμLμexp(−N(x¯¯¯−μx)22σ2x)∫UμLμexp⎛⎝⎜⎜−N(μy−[y−(x¯¯¯−μx)ρσyσx])22σ2y(1−ρ2)⎞⎠⎟⎟dμydμxdσxdσy
Ora la prima integrazione su può essere fatta modificando le variabili e il primo integrale su diventa:μyz=N−−√μy−[y−(x¯¯¯−μx)ρσyσx]σy1−ρ2√⟹dz=N√σy1−ρ2√dμyμy
σy2π(1−ρ2)−−−−−−−−√N−−√⎡⎣⎢Φ⎛⎝⎜Uμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟−Φ⎛⎝⎜Lμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟⎤⎦⎥
E da qui puoi vedere che non sono possibili soluzioni analitiche. Tuttavia, vale anche la pena notare che il valore non è stato eliminato dalle equazioni. Ciò significa che i dati e le informazioni precedenti hanno ancora qualcosa da dire sulla vera correlazione. Se i dati non dicessero nulla della correlazione, rimarremmo semplicemente con come unica funzione di in queste equazioni.ρp(ρ)ρ
Mostra anche come questo passaggio al limite di limiti infiniti per "butti via" alcune delle informazioni su , che sono contenute nella complicata normale funzione CDF . Ora, se hai molti dati, quindi passare al limite va bene, non perdi molto, ma se hai informazioni molto scarse, come nel tuo caso - è importante mantenere ogni scarto che hai. Significa brutti calcoli matematici, ma questo esempio non è troppo difficile da fare numericamente. Quindi possiamo valutare la probabilità integrata per a valori di abbastanza facilmente. Sostituisci semplicemente gli integrali con le somme su intervalli abbastanza piccoli, in modo da avere una tripla sommaμyρΦ(.)ρ−0.99,−0.98,…,0.98,0.99