Se hai utilizzato i ritorni di registro, hai commesso un errore di differenziazione, ma se hai utilizzato un valore futuro diviso per il valore attuale, la tua probabilità è errata. In realtà, la tua probabilità è sbagliata in entrambi i casi. È abbastanza sbagliato importare.
Considera che una statistica è una funzione dei dati. I ritorni non sono dati, sono trasformazioni di dati. Sono un valore futuro diviso per un valore presente. I prezzi sono dati. I prezzi devono avere una funzione di distribuzione, ma la funzione di distribuzione per i resi deve dipendere esclusivamente dalla natura dei prezzi.
ptpt + 1
pt + 1pt- 1.
1πσσ2+ ( y- β1X1- β2X2⋯ - βnXn- α )2.
OLS impone il miglior adattamento ai dati osservati anche se si tratta della soluzione sbagliata. I metodi bayesiani tentano di trovare la funzione di generazione dei dati attraverso la probabilità. Hai sbagliato la probabilità, quindi non è stato possibile trovarlo.
Ho un documento su questo se hai bisogno di ulteriori informazioni.
EDIT
Penso che tu abbia frainteso. Se convertissi la probabilità in una funzione di densità e prendessi le aspettative, scopriresti che non ne ha. A riprova di Augustin Cauchy nel 1852 o forse nel 1851, qualsiasi forma di soluzione dei minimi quadrati è perfettamente imprecisa. Fallirà sempre. Non è che dovresti usare la regressione standard perché il bayesiano è sensibile alla probabilità, è che Bayes è l'unica soluzione disponibile che è ammissibile, con alcune eccezioni speciali per alcuni casi speciali insoliti.
Nel fare i test empirici su questo, e prima di aver letto abbastanza della matematica, ho ingenuamente pensato che la soluzione bayesiana e quella frequentista dovessero corrispondere. C'è, approssimativamente, un teorema che dice che quando il campione diventa abbastanza grande, i due convergeranno. Ho usato tutte le negoziazioni di fine giornata nell'universo CRSP dal 1925 al 2013 per testarlo. Non è quello che dice il teorema. Stavo fraintendendo le regole.
Ho anche provato il problema nei registri, e ancora non corrispondeva. Così ho realizzato qualcosa, tutte le distribuzioni sono forme e quindi ho costruito una soluzione geometrica per determinare quale soluzione era corretta. L'ho trattato come un puro problema di geometria per determinare quale risposta algebrica corrispondeva ai dati.
Quello bayesiano si accordò. Questo mi ha portato su un percorso molto matematico perché non riuscivo a capire perché lo stimatore imparziale fosse così sbagliato. Per la cronaca, usando i rendimenti disaggregati nel periodo 1925-2013 e rimuovendo le società di copertura, i fondi chiusi e così via, la discrepanza tra il centro della posizione è del 2% e la misura del rischio è minimizzata del 4% per i rendimenti annuali . Questa discrepanza è soggetta alla trasformazione del registro, ma per un motivo diverso. Potrebbe essere diverso per singoli indici o sottoinsiemi di dati.
Il motivo della discrepanza è duplice. Il primo è che le distribuzioni coinvolte mancano di una statistica sufficiente. Per alcuni tipi di problemi, questo non ha importanza. Ai fini proiettivi, come la previsione o l'allocazione, tuttavia, sono abbastanza importanti. Il secondo motivo è che lo stimatore imparziale è sempre una versione della media, ma la distribuzione non ha media.
La densità sopra non è un membro della famiglia esponenziale come la distribuzione normale o gamma è. Secondo il teorema di Pitman – Koopman – Darmois, non esiste una statistica dei punti sufficiente per i parametri. Ciò implica che qualsiasi tentativo di creare uno stimatore punti deve eliminare informazioni. Questo non è un problema per le soluzioni bayesiane perché il posteriore è un'intera densità e se fosse necessaria una stima puntuale, è possibile trovare la densità predittiva e ridurre al minimo una funzione di costo su di essa per ridurla a un singolo punto. La probabilità bayesiana è sempre minimamente sufficiente.
Lo stimatore imparziale della varianza minima per la funzione sopra è quello di mantenere il 24,6% centrale dei dati, trovare la sua media tagliata e scartare il resto dei dati. Ciò significa che oltre il 75% dei dati viene eliminato e le informazioni vengono perse. Solo una nota, potrebbe essere del 24,8%, poiché sto lavorando dalla memoria. Puoi trovare l'articolo di Rothenberg su:
Rothenberg, TJ e FM Fisher e CB Tilanus, una nota sulla stima da un campione di Cauchy, Journal of American Statistical Association, 1964, vol 59 (306), pp. 460-463
Il secondo numero è stato sorprendente per me. Fino a quando non ho lavorato attraverso la geometria, non avevo capito quale fosse la causa. I rendimenti sono limitati in basso a -100%. Ciò sposta la mediana del 2% e l'intervallo interquartile viene spostato del 4% sebbene la mezza massa sia ancora negli stessi punti. La mezza massa è la misura corretta della scala, ma la mezza larghezza no. Se non ci fosse troncamento, allora la mezza larghezza e la mezza massa sarebbero negli stessi punti. Allo stesso modo, la mediana e la modalità rimarrebbero nello stesso punto. La mediana è il ritorno dell'attore medio o almeno del commercio medio. Come tale, è sempre la posizione della MVUE e la media dei log.
La corretta comprensione del teorema è che tutti gli stimatori bayesiani sono stimatori ammissibili. Gli stimatori frequentisti sono stimatori ammissibili se si ottiene una delle due condizioni. Il primo è che in ogni campione, la soluzione Frequentist e Bayesian sono identiche. Il secondo è che se la soluzione limitante del metodo bayesiano corrispondeva alla soluzione frequentista, allora la soluzione frequentista è ammissibile.
Tutti gli stimatori ammissibili convergono nella stessa soluzione quando le dimensioni del campione sono sufficientemente grandi. Lo stimatore frequentista presume che il suo modello sia il modello reale e che i dati siano casuali. Il bayesiano assume che i dati siano veri, ma il modello è casuale. Se avevi una quantità infinita di dati, il modello soggettivo deve convergere in realtà. Se avevi una quantità infinita di dati, ma un modello sbagliato, allora il modello Frequentist converge in realtà con probabilità zero.
In questo caso, la soluzione bayesiana, a condizioni ragionevoli, dominerà sempre stocasticamente qualsiasi stimatore frequentista a causa del troncamento e della perdita di informazioni per creare lo stimatore.
Nei log, la funzione di verosimiglianza è la distribuzione secante iperbolica. Ha una varianza finita, ma nessuna covarianza. La matrice di covarianza trovata usando OLS è un artefatto dei dati e non punta a un parametro esistente nei dati sottostanti. Come nel caso del modulo non elaborato, nulla nel covary del modulo di registro, ma neanche nulla è indipendente. Invece, esiste una relazione molto più complessa che viola la definizione di covarianza, ma in cui possono confondersi.
Markowitz e Usman l'hanno quasi trovato nel loro lavoro sulle distribuzioni, ma la distribuzione secolare iperbolica non appartiene a una famiglia Pearson e hanno frainteso i dati non notando che quando si cambia una distribuzione da dati grezzi a dati di registro si cambiano anche le sue proprietà statistiche . Fondamentalmente l'hanno scoperto, ma l'hanno perso perché non avevano motivo di cercarlo e non si sono resi conto delle conseguenze indesiderate dell'utilizzo dei registri.
Non ho Markowitz e Usman che mi citano dove sono, ma hanno fatto uno dei pochi ottimi lavori per stimare la distribuzione che sono là fuori.
In ogni caso, non uso JAGS. Non ho idea di come farlo. Codifico tutto il mio lavoro MCMC a mano.
Ho un documento che è molto più completo e accurato su questo argomento su:
Harris, DE (2017) The Distribution of Returns. Journal of Mathematical Finance, 7, 769-804.
Ti fornirà un metodo per costruire distribuzioni per qualsiasi classe di attività o passività, anche rapporti contabili.
Ero prolisso, ma potevo vedere che stavi fraintendendo il rapporto tra i metodi di Bayes e Pearson-Neyman. Li hai fatti invertire. Bayes funziona sempre, ma sei intrappolato con una densità precedente che disturberà la tua soluzione. Con un precedente adeguato ti viene garantito uno stimatore distorto e per questo tipo di funzione di verosimiglianza, credo che tu debba usare un preventivo adeguato per garantire integrabilità all'unità. I metodi frequentist sono veloci e di solito funzionano. Sono imparziali, ma potrebbero non essere validi.