Questa domanda riguarda la stima della massima verosimiglianza limitata (REML) in una particolare versione del modello lineare, vale a dire:
dove è una matrice ( ) parametrizzata da , così come . è un vettore sconosciuto di parametri di disturbo; l'interesse è nella stima e abbiamo . Stimare il modello con la massima probabilità non è un problema, ma voglio usare REML. È noto, ad esempio LaMotte , che la probabilità , dove è una matrice semi-ortogonale tale che può essere scritto
quando è il rango di colonna completo .
Il mio problema è che per alcuni perfettamente ragionevoli e scientificamente interessanti, la matrice non è di rango di colonna completo. Tutte le derivazioni che ho visto della probabilità limitata di cui sopra fanno uso di uguaglianze determinanti che non sono applicabili quando , cioè assumerà piena colonna posizione di . Ciò significa che la probabilità limitata sopra indicata è corretta solo per la mia impostazione su parti dello spazio dei parametri, e quindi non è ciò che voglio ottimizzare.
Domanda: Esistono probabilità più generali limitate, derivate, nella letteratura statistica o altrove, senza il presupposto che sia il rango di colonna completo? In tal caso, che aspetto hanno?
Alcune osservazioni:
- Derivare la parte esponenziale non è un problema per nessuna e può essere scritta in termini dell'inverso di Moore-Penrose come sopra
- Le colonne di sono una (qualsiasi) base ortonormale per
- Per noto , la probabilità di A ′ Y può essere facilmente annotata per ogni α , ma ovviamente il numero di vettori di base, ovvero colonne, in A dipende dal rango di colonna di X
Se qualcuno interessato a questa domanda ritiene che la parametrizzazione esatta di sarebbe di aiuto, fammi sapere e li scriverò. A questo punto, però, sono principalmente interessato a un REML per una X generale delle dimensioni corrette.
Segue una descrizione più dettagliata del modello. Lasciare tramite un r dimensionale primo ordine Vector Autoregressione [VAR (1)] dove v t i i D ~ N ( 0 , Ω ) . Supponiamo che il processo sia avviato con un valore fisso y 0 al momento t = 0 .
Definire . Il modello può essere scritto nella forma lineare Y = X β + ε usando le seguenti definizioni e notazioni:
dove denota una T - vettore tridimensionale di uno e posta 1 , T la prima base vettore standard R T .
Indica . Si noti che se A non è il rango completo, allora X ( α ) non è il rango della colonna intera. Ciò include, ad esempio, i casi in cui uno dei componenti di y t non dipende dal passato.
L'idea di stimare i VAR usando REML è ben nota, ad esempio, nella letteratura sulle regressioni predittive (vedere ad esempio Phillips e Chen e i riferimenti in essi).
Potrebbe essere utile chiarire che la matrice non è una matrice di progettazione nel senso comune, cade semplicemente fuori dal modello e, a meno che non ci sia una conoscenza a priori di A, non esiste, per quanto ne so, un modo di ricomparare essere al massimo livello.
Ho pubblicato una domanda su math.stackexchange che è correlata a questa, nel senso che una risposta alla domanda di matematica può aiutare a derivare una probabilità che risponderebbe a questa domanda.