Sto usando il processo gaussiano (GP) per la regressione.
Nel mio problema è abbastanza comune che due o più punti dati siano vicini l'uno all'altro, relativamente alle scale di lunghezza del problema. Inoltre, le osservazioni possono essere estremamente rumorose. Per accelerare i calcoli e migliorare la precisione delle misurazioni , sembra naturale unire / integrare gruppi di punti vicini l'uno all'altro, purché mi occupi delle previsioni su una scala di lunghezza maggiore.
Mi chiedo quale sia un modo rapido ma semi-basato per farlo.
Se due punti dati erano perfettamente sovrapposti, , e il rumore di osservazione (cioè la probabilità) è gaussiano, forse eteroschedastico ma noto , il modo naturale di procedere sembra fonderli in un unico punto dati con:
, perk=1,2.
Valore osservato che è una media dei valori osservati y ( 1 ) , y ( 2 ) ponderati per la precisione relativa: ˉ y = σ 2 y ( → x ( 2 ) ).
Rumore associato all'osservazione pari a: .
Tuttavia, come devo unire due punti vicini ma non sovrapposti?
Prima di procedere, mi chiedevo se ci fosse già qualcosa là fuori; e se questo sembra essere un modo ragionevole di procedere, o ci sono metodi rapidi migliori .
La cosa più vicina che potrei trovare in letteratura è questo articolo: E. Snelson e Z. Ghahramani, Sparse Gaussian Processes using Pseudo-input , NIPS '05; ma il loro metodo è (relativamente) coinvolto e richiede un'ottimizzazione per trovare gli pseudo-input.