Una Probabilità modello consiste della tripletta , dove Ω è lo spazio campionario, F è un σ -algebra (eventi) e P è una misura di probabilità su F .(Ω,F,P)ΩFσPF
Spiegazione intuitiva . Un modello di probabilità può essere interpretato come una nota variabile casuale . Ad esempio, sia X una variabile casuale normalmente distribuita con media 0 e varianza 1 . In questo caso la misura di probabilità P è associata alla funzione di distribuzione cumulativa (CDF) da F aXX01PF
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
Generalizzazioni . La definizione del modello di probabilità dipende dalla definizione matematica di probabilità, vedere ad esempio Probabilità libera e probabilità quantistica .
Un modello statistico è un insieme di modelli di probabilità, ovvero un insieme di misure / distribuzioni di probabilità sullo spazio campione Ω .SΩ
Questo insieme di distribuzioni di probabilità è di solito selezionato per modellare un certo fenomeno da cui abbiamo dati.
Spiegazione intuitiva . In un modello statistico, i parametri e la distribuzione che descrivono un certo fenomeno sono entrambi sconosciuti. Un esempio di ciò è la famiglia delle distribuzioni normali con media e varianza σ 2 ∈ R + , ovvero entrambi i parametri sono sconosciuti e in genere si desidera utilizzare il set di dati per stimare i parametri (ovvero selezionare un elemento di S ). Questo insieme di distribuzioni può essere scelto su qualsiasi Ω e F , ma, se non sbaglio, in un esempio reale solo quelli definiti sulla stessa coppia ( Ω , F )μ∈Rσ2∈R+SΩF(Ω,F) sono ragionevoli da considerare.
Generalizzazioni . Questo documento fornisce una definizione molto formale del modello statistico, ma l'autore menziona che "il modello bayesiano richiede un componente aggiuntivo sotto forma di una distribuzione precedente ... Sebbene le formulazioni bayesiane non siano l'obiettivo principale di questo documento". Pertanto, la definizione di modello statistico dipende dal tipo di modello che utilizziamo: parametrico o non parametrico. Anche nell'impostazione parametrica, la definizione dipende da come vengono trattati i parametri (ad es. Classica vs. bayesiana).
La differenza è: in un modello di probabilità si conosce esattamente la misura di probabilità, ad esempio un , dove μ 0 , σ 2 0 sono parametri noti., Mentre in un modello statistico si considerano insiemi di distribuzioni , ad esempio Normale ( μ , σ 2 ) , dove μ , σ 2 sono parametri sconosciuti.Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2
Nessuno di essi richiede un set di dati, ma direi che un modello statistico viene solitamente selezionato per modellarne uno.