Poiché lo scopo qui è presumibilmente quello di ottenere una stima valida e utile di , la distribuzione precedente dovrebbe essere coerente con le specifiche della distribuzione della popolazione da cui proviene il campione. Ciò NON significa in alcun modo che "calcoliamo" il precedente utilizzando il campione stesso, annullando la validità dell'intera procedura. Sappiamo che la popolazione da cui proviene il campione è una popolazione di variabili casuali iid uniformi che vanno ciascuna in . Questa è un'ipotesi mantenuta e fa parte delle informazioni precedenti che possediamo (e non ha nulla a che fare con il campione , cioè con una realizzazione specifica di un sottoinsieme di queste variabili casuali).θ[0,θ]
Ora supponiamo che questa popolazione sia composta da variabili casuali (mentre il nostro campione è costituito da realizzazioni di variabili casuali). L'ipotesi mantenuta ci dice che
mn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
Indicare per compattezza . Quindi abbiamo che può anche essere scritto
maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
La funzione di densità di di iid Uniform rv che varia in è
maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
per il supporto , e lo zero altrove. Quindi usando e applicando la formula del cambio di variabile otteniamo una distribuzione precedente per che è coerente con l'assunto mantenuto:
[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
che può essere improprio se non specifichiamo adeguatamente la costante . Ma il nostro interesse sta nell'avere un vero e proprio posteriore per , e inoltre, non vogliamo limitare i possibili valori di (oltre la restrizione implicita dall'assunto mantenuto). Quindi lasciamo indeterminato.
Quindi scrivendo il posteriore ècθθc
X={x1,..,xn}
f(θ∣X)∝θ−NNcNθ−1⇒f(θ∣X)=ANcNθ−(N+1)
per qualche costante normalizzante A. Vogliamo
∫Sθf(θ∣X)dθ=1⇒∫∞x∗ANcNθ−(N+1)dθ=1
⇒ANcN1−Nθ−N∣∣∞x∗=1⇒A=(cx∗)N
Inserimento nella posteriore
f(θ∣X)=(cx∗)NNcNθ−(N+1)=N(x∗)Nθ−(N+1)
Si noti che la costante indeterminata della distribuzione precedente è stata annullata convenientemente.c
Il posteriore riassume tutte le informazioni che il campione specifico può darci riguardo al valore di . Se vogliamo ottenere un valore specifico per , possiamo facilmente calcolare il valore atteso del posteriore,
θθ
E(θ∣X)=∫∞x∗θN(x∗)Nθ−(N+1)dθ=−NN−1(x∗)Nθ−N+1∣∣∞x∗=NN−1x∗
C'è qualche intuizione in questo risultato? Bene, con l' aumentare del numero di , più è probabile che la massima realizzazione tra loro sia sempre più vicina al loro limite superiore, - che è esattamente ciò che riflette il valore medio posteriore di : se, diciamo , , ma se . Ciò dimostra che la nostra tattica relativa alla selezione del priore era ragionevole e coerente con il problema in questione, ma non necessariamente "ottimale" in un certo senso.XθθN=2⇒E(θ∣X)=2x∗N=10⇒E(θ∣X)=109x∗