Esiste uno "standard" per la notazione del modello statistico?


10

Ad esempio, nel manuale BUGS o nel libro in uscita di Lee e Wagenmakers ( pdf ) e in molti altri luoghi viene usato un tipo di notazione che a me sembra molto flessibile in quanto può essere usato per descrivere sinteticamente la maggior parte dei modelli statistici. Un esempio di questa notazione è il seguente:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

che descriverebbe un modello logistico gerarchico senza predittori, ma con gruppi . Questo modo di descrivere i modelli sembra funzionare altrettanto bene per descrivere i modelli frequentista e bayesiano, ad esempio, per rendere questa descrizione del modello completamente bayesiana dovresti solo aggiungere priori su μ p e σ p .i=1nμpσp

Questo tipo di notazione / formalismo modello è descritto in dettaglio in alcuni articoli o libri?

Se vuoi usare questa notazione per scrivere modelli, ci sono molti modi diversi di fare le cose e sarebbe davvero utile con una guida completa sia da seguire che a cui fare riferimento. Alcune differenze che ho riscontrato nel modo in cui le persone usano questo tipo di notazione:

  • Come si chiama distribuzioni? Ad esempio, ho visto , ecc.N,N,Norm,Normal
  • Come gestisci gli indici? Ad esempio, ho visto , y i [ j ] , y j | io , ecc.yijyi[j]yj|i
  • μ

Domanda di follow-up: questa notazione ha un nome? (Per mancanza di un nome migliore, l'ho definita la convenzione incentrata sulla distribuzione della probabilità in un post sul blog che ho scritto ...)

Risposte:


2

Alcuni standard raccomandati per la notazione statistica sono presentati in Halperin, Hartley and Hoel (1965) e Sanders and Pugh (1972) . La maggior parte della notazione attuale proviene da convenzioni stabilite dagli statistici biometrici tra la fine del 19 ° e l'inizio del 20 ° secolo (la maggior parte è stata fatta da Pearson e Fisher e dai loro associati). Un utile elenco dei primi usi della notazione è gestito dall'economista John Aldrich qui , e un resoconto storico della scuola biometrica inglese è pubblicato su Aldrich (2003) . (Se hai ulteriori domande su questo argomento, Aldrich è probabilmente il principale esperto vivente del mondo nella storia della notazione nelle statistiche.)

A parte questo lavoro esplicito, ci sono molti libri che danno introduzioni al campo, e questi sono attenti a definire la notazione coerente con le convenzioni comuni, definendo la notazione mentre procedono. Ci sono molte convenzioni ben note in questo campo che corrono costantemente attraverso la letteratura, e gli statistici le conoscono bene attraverso la pratica, anche senza aver letto le raccomandazioni di questi ricercatori.

relazione con significato "... ha distribuzione ..." o "... ha misura di probabilità ...", ecc. Sotto questa interpretazione la relazione confronta due distinti insiemi di cose; l'oggetto sul lato sinistro è una variabile casuale e l'oggetto sul lato destro è una descrizione di una misura di probabilità.

Questo dà due possibili (e ugualmente valide) interpretazioni di un'affermazione come:

XN(μ,σ2).
  • XN(μ,σ2)

  • XN(μ,σ2)


Aldrich, J. (2003) The Language of the English Biometric School International Statistical Review 71 (1) , pagg. 109-131.

Halperin, M., Hartley, HO e Hoel, PG (1965) Standard raccomandati per simboli statistici e notazione . The American Statistician 19 (3) , pagg. 12-14.

Sanders, JR e Pugh, RC (1972) Raccomandazione per un insieme standard di simboli e notazioni statistiche . Educational Researcher 1 (11) , pagg. 15-16.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.