Probabilità
Problemi comuni nella teoria della probabilità si riferiscono alla probabilità delle osservazioni dato un determinato modello e dati i parametri (chiamiamoli ) coinvolti. Ad esempio, le probabilità di situazioni specifiche nei giochi di carte o nei dadi sono spesso molto semplici.x1,x2,...,xnθ
Tuttavia, in molte situazioni pratiche abbiamo a che fare con una situazione inversa ( statistica inferenziale ). Cioè: viene data l'osservazione e ora il modello è sconosciuto , o almeno non conosciamo alcuni parametri .x1,x2,...,xkθ
In questo tipo di problemi ci riferiamo spesso a un termine chiamato la probabilità dei parametri, , che è un tasso di credenza in un parametro specifico dato osservazioni . Questo termine è espresso come proporzionale alla probabilità per le osservazioni supponendo che un parametro modello sarebbe ipoteticamente vero. L(θ)θx1,x2,..xkx1,x2,..xkθL(θ,x1,x2,..xk)∝probability observations x1,x2,..xk given θ
Per un dato valore di parametro più è probabile una certa osservazione è (rispetto alla probabilità con altri valori di parametro), più l'osservazione supporta questo particolare parametro (o teoria / ipotesi che assume questo parametro) . Un'alta (relativa) probabilità rafforzerà le nostre convinzioni su quel valore di parametro (c'è molto più filosofico da dire al riguardo).θx1,x2,..xn
Probabilità nel problema del carro armato tedesco
Ora per il problema del serbatoio tedesco la funzione di probabilità per un set di campioni è:x1,x2,..xk
L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0(θk)−1if max(x1,x2,..xk)>θif max(x1,x2,..xk)≤θ,
Se si osservano campioni {1, 2, 10} o campioni {8, 9, 10} non dovrebbe importare quando i campioni vengono considerati da una distribuzione uniforme con parametro . Entrambi i campioni sono ugualmente probabili con probabilità e usando l'idea di probabilità un campione non dice di più sul parametro rispetto all'altro campione.θ(θ3)−1θ
I valori alti {8, 9, 10} potrebbero farti pensare / credere che dovrebbe essere più alto. Ma è solo il valore {10} che ti dà davvero informazioni rilevanti sulla probabilità di (il valore 10 ti dice che sarà dieci o superiore, gli altri valori 8 e 9 non contribuiscono a queste informazioni ).θθθ
Teorema di fattorizzazione di Fisher Neyman
Questo teorema ti dice che una certa statistica (cioè una funzione delle osservazioni, come la media, la mediana o come nel problema del serbatoio tedesco il massimo) è sufficiente (contiene tutte le informazioni) quando puoi escludere, nella funzione di verosimiglianza, i termini che dipendono dalle altre osservazioni , in modo tale che questo fattore non dipenda sia dal parametro che da (e la parte della funzione di probabilità che mette in relazione i dati con i valori dei parametri ipotetici dipende solo dalla statistica ma non dall'insieme dei dati / osservazioni).T(x1,x2,…,xk)x1,x2,…,xkθx1,x2,…,xk
Il caso del problema dei carri armati tedeschi è semplice. Puoi vedere sopra che l'intera espressione per la probabilità di cui sopra dipende già solo dalla statistica e il resto dei valori non ha importanza.max(x1,x2,..xk)x1,x2,..xk
Piccolo gioco come esempio
Diciamo che giochiamo ripetutamente il seguente gioco: è esso stesso una variabile casuale e disegnata con uguale probabilità sia 100 che 110. Quindi disegniamo un campione .θx1,x2,...,xk
Vogliamo scegliere una strategia per indovinare , basata che massimizzi la nostra probabilità di avere la giusta ipotesi di .θx1,x2,...,xkθ
La strategia corretta sarà quella di scegliere 100 a meno che uno dei numeri nel campione sia> 100.
Potremmo essere tentati di scegliere il valore del parametro 110 già quando molti dei tendono ad essere tutti valori alti vicini a cento (ma nessuno esattamente oltre cento), ma sarebbe sbagliato. La probabilità di tale osservazione sarà maggiore quando il valore del parametro vero è 100 rispetto a quando è 110. Quindi, se indoviniamo, in tale situazione, 100 come valore del parametro, allora avremo meno probabilità di commettere un errore (perché il situazione con questi valori alti vicini a cento, eppure ancora al di sotto di esso, si verifica più spesso nel caso in cui il valore reale sia 100 anziché nel caso in cui il valore reale sia 110).x1,x2,...,xk