Regressione sul disco dell'unità a partire da campioni "spaziati uniformemente"


9

Devo risolvere un complicato problema di regressione sul disco dell'unità. La domanda originale ha attirato alcuni commenti interessanti, ma purtroppo nessuna risposta. Nel frattempo, ho imparato qualcosa in più su questo problema, quindi cercherò di dividere il problema originale in sottoproblemi e vedere se ho più fortuna questa volta.

Ho 40 sensori di temperatura regolarmente distanziati in un anello stretto all'interno del disco dell'unità: inserisci qui la descrizione dell'immagine

Questi sensori acquisiscono la temperatura nel tempo. Tuttavia, poiché la variazione del tempo è molto più piccola della variazione dello spazio, semplifichiamo il problema ignorando la variabilità temporale e supponiamo che ogni sensore mi dia solo una media temporale. Ciò significa che ho 40 campioni (uno per ciascun sensore) e non ho campioni ripetuti.

T=f(ρ,θ)+ϵ

  1. Tmean=g1(ρ)+ϵθ
  2. T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

θ

Una volta scelto il modello, devo scegliere una procedura di stima. Poiché si tratta di un problema di regressione spaziale, è necessario correlare errori in posizioni diverse. I minimi quadrati ordinari presuppongono errori non correlati, quindi immagino che i minimi quadrati generalizzati sarebbero più appropriati. GLS sembra una tecnica statistica relativamente comune, dato che esiste una glsfunzione nella distribuzione R standard. Tuttavia, non ho mai usato GLS e ho dei dubbi. Ad esempio, come posso stimare la matrice di covarianza? Un esempio elaborato, anche con pochi sensori, sarebbe fantastico.

PS Ho scelto di usare i polinomi di Zernike e GLS perché mi sembra la cosa logica da fare qui. Tuttavia non sono un esperto, e se senti che sto andando nella direzione sbagliata, sentiti libero di usare un approccio completamente diverso.


θ

Risposte:


2

Penso che tu sia sulla buona strada nel pensare a qualcosa come i polinomi di Zernike. Come notato nella risposta da jwimberly, questi sono un esempio di un sistema di funzioni di base ortogonale su un disco. Non ho familiarità con i polinomi di Zernike, ma molte altre famiglie di funzioni ortogonali (comprese le funzioni di Bessel) sorgono naturalmente nella fisica matematica classica come autofunzioni per alcune equazioni differenziali parziali (al momento in cui scrivo, l'animazione in cima a quel link anche mostra un esempio di una testa di tamburo vibrante).

θ

rT95

In termini di questa seconda domanda, la variabilità dei dati potrebbe effettivamente aiutare con qualsiasi problema di aliasing, consentendo essenzialmente a qualsiasi disallineamento di fare una media delle diverse misurazioni. (Supponendo che nessun pregiudizio sistematico ... ma ciò costituirebbe un problema per qualsiasi metodo, senza ad esempio un modello fisico per fornire maggiori informazioni).

Quindi una possibilità sarebbe quella di definire le funzioni ortogonali spaziali esclusivamente nelle posizioni dei sensori. Queste "Funzioni ortogonali empiriche" possono essere calcolate tramite PCA sulla matrice di dati spazio-temporali. (Forse potresti usare un po 'di ponderazione per tenere conto delle aree di supporto del sensore variabili, ma data la griglia polare uniforme e l'obiettivo delle medie radiali, questo potrebbe non essere necessario.)

Si noti che se v'è alcun dato modellazione fisici disponibili per variazioni "attesa" della temperatura, disponibili su una griglia computazionale spaziotemporale densa, quindi la stessa procedura PCA potrebbe essere applicata a che i dati alle funzioni ortogonali derivazione. (Questo in genere viene chiamato " corretta decomposizione ortogonale " in ingegneria, dove viene utilizzato per la riduzione del modello, ad esempio un costoso modello di fluidodinamica computazionale può essere distillato per l'uso in ulteriori attività di progettazione.)

Un commento finale, se si dovessero ponderare i dati del sensore in base all'area di supporto (ovvero la dimensione delle celle polari), questo sarebbe un tipo di covarianza diagonale, nell'ambito di GLS . (Ciò si applicherebbe maggiormente al problema di previsione, sebbene la PCA ponderata sarebbe strettamente correlata.)

Spero che questo possa essere d'aiuto!

Aggiornamento: il nuovo diagramma della distribuzione del sensore cambia notevolmente le cose a mio avviso. Se si desidera stimare le temperature all'interno del disco, è necessario un precedente molto più informativo rispetto al semplice "set di funzioni ortogonali sul disco dell'unità". Ci sono troppe poche informazioni nei dati del sensore.

Se vuoi davvero stimare la variazione della temperatura spaziale sul disco, l'unico modo ragionevole che posso vedere sarebbe di trattare il problema come uno di assimilazione dei dati . Qui dovresti almeno limitare la forma parametrica della distribuzione spaziale basata su alcune considerazioni basate sulla fisica (queste potrebbero derivare da simulazioni o potrebbero derivare da dati correlati in sistemi con dinamiche simili).

Non so la vostra applicazione particolare, ma se si tratta di qualcosa di simile a questo , quindi immagino ci sia una vasta letteratura di ingegneria che si potrebbe attingere per scegliere appropriati vincoli precedenti. (Per quel tipo di conoscenza dettagliata del dominio, questo non è probabilmente il miglior sito StackExchange su cui chiedere.)


Risposta impressionante! Ho bisogno di un po 'di tempo per digerirlo. Poni due domande: non sono sicuro di aver capito il primo ("Di quanto vincolo hai bisogno sul modello spaziale?") Pensavo che usare i dati di tutti e 40 i sensori sarebbe stato meglio che fare una media lungo la direzione circonferenziale e quindi adatto ... stai dicendo che questo non è necessariamente vero? Per il secondo ("quali tipi di variabilità si verificano nei dati spazio-temporali"), nei prossimi uno o due giorni analizzerò il primo motore (ne ho effettivamente 5! Ma questo sarà l'argomento di un domanda futura ...) ctd ...
DeltaIV

... ctd, normalizzerò i dati e vedrò cosa posso pubblicare su un sito pubblico. Alcuni schemi spaziali e alcune serie temporali ... Penso che dovrebbero darti un'idea di ciò che stai chiedendo.
DeltaIV,

1
Per la mia prima domanda: se il tuo obiettivo finale è essenzialmente "prevedere i risultati dei sensori per un nuovo motore" (dedotto dall'altra tua domanda), allora hai davvero bisogno di informazioni da "tra i sensori" ?. Il mio commento sull'aliasing è stato un esempio del perché avresti bisogno di tali informazioni, ad esempio seT95

1
A proposito, se questo è un problema di progettazione e ci sono simulazioni di tipo CFD associate, allora si tratta di un numero significativamente maggiore di informazioni rispetto alla domanda attuale. (Ad esempio, affrontare il problema come assimilazione dei dati potrebbe utilizzare approcci diversi.)
GeoMatt22

La tua risposta mi fa pensare: al posto della regressione, c'è qualche equivalente 2d di una trasformata discreta di Fourier che potrebbe essere fatta? Ad esempio, prendendo l'integrale dei punti dati per la funzione n-esima di Bessel (opportunamente modificata), e quindi ottenendo una decomposizione ortogonale? Le preoccupazioni qui sarebbero 1) trovare la funzione discreta adeguata appropriata, possibilmente lungo le stesse linee della tua risposta, e 2) se questo sarebbe troppo sensibile al piccolo numero di punti di campionamento e la decomposizione si appoggerebbe a termini di ordine superiore più complicati .
jwimberley,

2

I polinomi di Zernlike non sembrano una cattiva scelta, dal momento che hanno già rθ


(+1) La connessione dell'equazione del calore a coordinate polari è buona. Un altro forse degno di nota è che per i processi gaussiani conosco comunemente su griglie rettangolari la matrice di covarianza è circolante e praticamente vengono utilizzate le FFT. Quindi le funzioni di Bessel sarebbero probabilmente un candidato per un approccio simile su una griglia polare.
GeoMatt22,

Un suggerimento interessante! Tuttavia, sto misurando la temperatura nel fluido operativo, non nella parte solida del motore. Quindi sono interessato al problema della convezione, al contrario del problema della conduzione. Le funzioni di Bessel sono sicuramente soluzioni dell'equazione di conduzione del calore (Fourier), ma non penso che siano anche una soluzione dell'equazione della convezione del calore, poiché la convezione dipende dal campo del flusso del fluido. Ad ogni modo, potrei almeno provarli contro lo Zernike. Che dire di GLS? Potresti aggiungere qualcosa anche su quella parte della domanda?
DeltaIV,

@DeltaIV Non ho molta familiarità con GLS, ma una domanda: perché ti aspetti che gli errori siano correlati in diversi punti spaziali? Concordo sul fatto che le fluttuazioni reali saranno correlate tra i punti, ma riterrei che gli errori (ovvero l'incertezza nelle letture dei sensori) non siano correlati. Forse per le fluttuazioni della regressione contano come errori? Sto considerando di aggiungere qualcosa sui termini di penalizzazione, tuttavia. Qualunque sia la base che usi, hai solo un numero finito di punti di campionamento e potresti trovare qualche funzione di Bessel corrispondente all'ordine molto alto, quindi i termini di ordine più basso dovrebbero essere preferiti.
jwimberley,

@DeltaIV Riguardo ancora alle fluttuazioni, che introdurrebbe correlazioni tra i punti spaziali: il tuo oggetto è ottenere una mappa della temperatura, no? Non vuoi vedere quali fluttuazioni si verificano? E un modello statistico potrebbe anche giustificarli, poiché le fluttuazioni sarebbero guidate dalla fluidodinamica e complicate nello spazio e nel tempo? (È legato alla parte della tua analisi dipendente dal tempo che hai interrotto per semplicità?)
jwimberley,

chat della galleria creata .
DeltaIV,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.