Differenze tra un modello statistico e un modello di probabilità?


29

La probabilità applicata è un ramo importante della probabilità, compresa la probabilità computazionale. Dato che la statistica sta usando la teoria della probabilità per costruire modelli per gestire i dati, come ho capito, mi chiedo quale sia la differenza essenziale tra modello statistico e modello di probabilità? Il modello di probabilità non ha bisogno di dati reali? Grazie.

Risposte:


29

Una Probabilità modello consiste della tripletta , dove Ω è lo spazio campionario, F è un σ -algebra (eventi) e P è una misura di probabilità su F .(Ω,F,P)ΩFσPF

Spiegazione intuitiva . Un modello di probabilità può essere interpretato come una nota variabile casuale . Ad esempio, sia X una variabile casuale normalmente distribuita con media 0 e varianza 1 . In questo caso la misura di probabilità P è associata alla funzione di distribuzione cumulativa (CDF) da F aXX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

Generalizzazioni . La definizione del modello di probabilità dipende dalla definizione matematica di probabilità, vedere ad esempio Probabilità libera e probabilità quantistica .

Un modello statistico è un insieme di modelli di probabilità, ovvero un insieme di misure / distribuzioni di probabilità sullo spazio campione Ω .SΩ

Questo insieme di distribuzioni di probabilità è di solito selezionato per modellare un certo fenomeno da cui abbiamo dati.

Spiegazione intuitiva . In un modello statistico, i parametri e la distribuzione che descrivono un certo fenomeno sono entrambi sconosciuti. Un esempio di ciò è la famiglia delle distribuzioni normali con media e varianza σ 2R + , ovvero entrambi i parametri sono sconosciuti e in genere si desidera utilizzare il set di dati per stimare i parametri (ovvero selezionare un elemento di S ). Questo insieme di distribuzioni può essere scelto su qualsiasi Ω e F , ma, se non sbaglio, in un esempio reale solo quelli definiti sulla stessa coppia ( Ω , F )μRσ2R+SΩF(Ω,F) sono ragionevoli da considerare.

Generalizzazioni . Questo documento fornisce una definizione molto formale del modello statistico, ma l'autore menziona che "il modello bayesiano richiede un componente aggiuntivo sotto forma di una distribuzione precedente ... Sebbene le formulazioni bayesiane non siano l'obiettivo principale di questo documento". Pertanto, la definizione di modello statistico dipende dal tipo di modello che utilizziamo: parametrico o non parametrico. Anche nell'impostazione parametrica, la definizione dipende da come vengono trattati i parametri (ad es. Classica vs. bayesiana).

La differenza è: in un modello di probabilità si conosce esattamente la misura di probabilità, ad esempio un , dove μ 0 , σ 2 0 sono parametri noti., Mentre in un modello statistico si considerano insiemi di distribuzioni , ad esempio Normale ( μ , σ 2 ) , dove μ , σ 2 sono parametri sconosciuti.Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

Nessuno di essi richiede un set di dati, ma direi che un modello statistico viene solitamente selezionato per modellarne uno.


2
@HonglangWang Questo è corretto in una certa misura. La differenza principale è che un modello di probabilità è solo una (nota) distribuzione, mentre un modello statistico è un insieme di modelli di probabilità; i dati vengono utilizzati per selezionare un modello da questo set o un sottoinsieme più piccolo di modelli che meglio (in un certo senso) descrivono il fenomeno (alla luce dei dati).

2
(+1) Questa è una bella risposta, anche se ho un paio di commenti. In primo luogo, penso che questo potrebbe vendere il probabilista un po 'corto. Non è affatto raro considerare un insieme di spazi di probabilità in un modello probabilistico, e in effetti le possibili misure possono anche essere casuali (costruite su uno spazio adeguatamente più ampio). In secondo luogo, un bayesiano (in particolare) potrebbe trovare questa risposta leggermente sconcertante in quanto un modello statistico bayesiano può spesso essere visto come un singolo modello di probabilità su uno spazio di prodotto adeguato . Ω×Θ
cardinale il

1
@gung Questa è una domanda relativa alla teoria delle misure. Per quanto riguarda la tua prima domanda, è in effetti definito attraverso il CDF. Ora, l'interpretazione di Ω è difficile perché, formalmente, P ( X x ) significa P ( ω Ω : X ( ω ) x ) , quindi Ω non sono valori osservabili. F è un σ - algebra che è la pre-immagine dell'algebra di Borel σ - sotto XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX, ancora una volta questo non è osservabile. Non sono sicuro di come spiegarlo a livello intuitivo.

2
@gung dipende dall'applicazione ; non è determinato dalla teoria. Ad esempio, Ω potrebbe essere un insieme di movimenti browniani che descrivono il prezzo di un derivato finanziario e X potrebbe essere il valore raggiunto in un tempo fisso t . In un'altra applicazione Ω potrebbe essere un insieme di persone e X potrebbe essere la lunghezza dei loro avambracci. Generalmente, Ω è un modello matematico degli oggetti fisici di studio e X è una proprietà numerica di quegli oggetti. F è l'insieme dei possibili eventi: quelle situazioni alle quali vogliamo attribuire le probabilità.ΩΩXtΩXΩXF
whuber

2
@gung è una sigma algebra : è una raccolta di sottoinsiemi (gli "eventi"). Nell'applicazione finanziaria, è un insieme di storici dei prezzi; nell'applicazione delle misure dell'avambraccio, gli eventi sarebbero insiemi di persone. Possiamo parlarne di più se vuoi in una chat room. F
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.