Confronto tra coefficienti di regressione dello stesso modello tra diversi set di dati


12

Sto valutando due (2) refrigeranti (gas) che sono stati utilizzati nello stesso sistema di refrigerazione. Ho dati saturi di temperatura di aspirazione ( ), temperatura di condensazione ( ) e amperaggio ( ) per la valutazione. Esistono due (2) set di dati; 1o refrigerante ( ) e 2o refrigerante ( ). Sto usando un modello polinomiale lineare, multivariato ( & ), di terzo ordine per le analisi di regressione. Vorrei determinare quanto meno / più amperaggio (o una metrica simile come confronto delle prestazioni) in media, in percentuale, viene prelevato dal secondo refrigerante.D Y R 1 R 2 S DSDYR1R2SD

Il mio primo pensiero è stato:

  1. Determinare il modello da utilizzare:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. Derivare i coefficienti ( ) dai dati di base ( ).R 1biR1
  3. Utilizzando tali coefficienti, per ogni & nel set di dati , calcolare ogni sorteggio di ampli atteso ( ) e quindi media.D R 2 YSDR2Y^
  4. Confronta la media con l'amplificazione media effettiva ( ) dei dati . Y2R2Y^Y2R2
  5. variazione percentuale (%)=(Y2-Y^)/Y^

Tuttavia, poiché il secondo refrigerante ha proprietà termiche leggermente diverse e sono state apportate piccole modifiche al sistema di refrigerazione (regolazioni TXV e surriscaldamento), non credo che questo "metodo di confronto di base" sia accurato.

Il mio prossimo pensiero è stato quello di fare due (2) analisi di regressione separate:

Y1=un'0+un'1S1+un'2D1+un'3S1D1+un'4S12+un'5D12+un'6S12D1+un'7D12S1+un'8D13+un'9S13Y2=B0+B1S2+B2D2+B3S2D2+B4S22+B5D22+B6S22D2+B7D22S2+B8D23+B9S23

e quindi, per la temperatura di aspirazione satura ( ), confrontare i coefficienti ( vs ) in questo modo: a 1 b variazione dell'1 % = b 1 - a 1Sun'1B1

% modificare=B1-un'1un'1

Tuttavia, ancora una volta, questi coefficienti dovrebbero essere ponderati in modo diverso. Pertanto, i risultati sarebbero distorti.

Credo di poter usare un test z per determinare quanto sono ponderati i coefficienti in modo diverso, ma non sono sicuro di aver compreso appieno il significato dell'output: . Ma ciò non mi darebbe comunque una metrica delle prestazioni, che è l'obiettivo generale.z=(un'1-B1)/SEun'12+SEB12)


1
1. Un modello polinomiale è un modello lineare, poiché è lineare nel coefficiente. 2. Sto cercando di capire la tua domanda. Se il sistema di refrigerazione è stato modificato tra il momento in cui sono stati utilizzati R1 e R2, in realtà non sono lo stesso "sistema di refrigerazione" (linea 1), giusto? 3. Perché nel tuo secondo approccio hai iniziato a confrontare i coefficienti di S? 4. Hai mai preso in considerazione l'introduzione di un 'refrigerante' covariato con livelli R1 e R2 nell'adattamento polinomiale (forse con interazione)? Il suo coefficiente potrebbe rispondere alla domanda.
qoheleth,

@qoheleth 1. Non sono sicuro di seguire la tua linea di pensiero ... Il coefficiente è sempre lineare - è un numero. Quando allora il coefficiente non sarebbe lineare? 2. Corretto, il sistema di refrigerazione è stato leggermente modificato, ma solo per garantire la stessa temperatura di uscita per entrambi i refrigeranti: "mele a mele". 3. "S" è l'unica variabile di interesse per questo confronto specifico. 4. Ho letto del metodo variabile covariata / interagente, ma non riesco a capire il significato dei coefficienti usando tale metodo. Puoi approfondire l'interpretazione dell'output? Grazie.
gth826a,

1. dal punto di vista statistico, ciò che conta è la linearità delle cose che si stanno stimando, quindi un modello polinomiale è lineare. Un esempio di un modello non lineare sarebbe la funzione mitscherlich y = alpha (1-exp (beta-lambda * X)), dove alpha / beta / lambda sono ciò che stiamo stimando. 3. Cosa stai effettivamente cercando di testare? è il coefficiente di S? o Y? Se è S, perché il tuo primo tentativo è un confronto in \ hat {Y}?
qoheleth,

Y-hat sarebbe: l'effettivo S & D dal 2 ° set di dati utilizzato con i coefficienti derivati ​​dal 1 ° set di dati. Questo metodo è comune per le analisi energetiche del "Contratto di prestazione" quando si confrontano il consumo di energia delle apparecchiature precedenti con il consumo di energia dopo una modifica / ristrutturazione / ristrutturazione / ecc. L'equazione sarebbe: consumo di energia = y-hat = baseload + energia / grado-giorno * gradi-giorni ... dove energia / grado-giorno è il coeff derivato dall'analisi di regressione di base e gradi-giorni è dopo il rinnovo . Il "cosa avresti consumato" se non avessi fatto questo scenario di progetto ...
gth826a

1
Quindi sembra che alla fine tu voglia confrontare Y. Direi di dimenticare di calcolare la variazione% nei coefficienti, in presenza di termini di ordine superiore (S ^ 2, S ^ 3 ecc.), I coefficienti non sono ciò che pensi loro sono. Concentrati su Y. La domanda che mi rimane poco chiara è: stai dicendo che S & D in R2 significa cose diverse da S & D in R1? Altrimenti, puoi semplicemente adattare un modello all'insieme di dati combinato, con una covariata aggiuntiva (variabile X) chiamata refrigerante (r1 o r2) e osservarne il coefficiente per fare l'inferenza, supponendo che il tuo modello sia adeguato.
qoheleth,

Risposte:


2

Dalla legge del gas ideale qui , , che suggerisce un modello proporzionale. Assicurati che le tue unità siano a temperatura assoluta. Chiedere un risultato proporzionale implicherebbe un modello di errore proporzionale. Considera, forse Y = a D b S c , quindi per la regressione lineare multipla si può usare ln ( Y ) = ln ( a ) + b ln ( D ) + c ln ( S )PV=nRTY=un'DBScln(Y)=ln(un')+Bln(D)+cln(S)prendendo i logaritmi dei valori Y, D e S, in modo che questo assomigli a , dove i pedici l significano "logaritmo di". Ora, questo potrebbe funzionare meglio del modello lineare che si sta utilizzando e, quindi, le risposte sono relative al tipo di errore.Yl=un'l+BDl+cSll

Per verificare quale tipo di modello utilizzare provare uno e verificare se i residui sono omoscedastici. Se non lo sono, allora hai un modello distorto , quindi fai qualcos'altro come modellare i logaritmi, come sopra, uno o più reciproci di dati x o y, radici quadrate, quadratura, esponenziazione e così via fino a quando i residui non sono omoscedastici. Se il modello non è in grado di produrre residui omoscedastici, utilizzare la regressione di Theil lineare multipla, con censura se necessario.

Non è richiesto come normalmente i dati siano distribuiti sull'asse y, ma i valori anomali possono e spesso distorcono in modo marcato i risultati dei parametri di regressione. Se l'omoscedasticità non può essere trovata, i minimi quadrati ordinari non devono essere utilizzati e deve essere eseguito qualche altro tipo di regressione, ad esempio regressione ponderata, regressione di Theil, minimi quadrati in x, regressione di Deming e così via. Inoltre, gli errori non dovrebbero essere correlati in serie.

Il significato dell'output: z=(un'1-B1)/SEun'12+SEB12)X,yH=+UN2+O2zN

C2=UN2+B2-2UNBcos(θ),θ=(UN,B)σTρUN,BσT2=σUN2+σB2-2σUNσBρUN,B


"Per verificare quale tipo di modello utilizzare provane uno e controlla se i residui sono omoscedastici", sì certo ... tranne che per non fare affatto questo presupposto, e anche se è valido - non garantisce in alcun modo che hai un modello "buono".
Repmat,

Se si usa OLS e i residui sono eteroscedastici, allora sicuramente si ha un modello distorto. L'omoscedasticità è un requisito OLS, mostrato qui . Avere un buon modello richiede altre condizioni, come evitare distorsioni delle variabili omesse , ma avere errori seriali non correlati e linearità del modello rispetto alla variabile dipendente.
Carl,

Puoi avere un modello imparziale e / o coerente (stime) in cui i residui sono eteroschedastici. Ciò implicherebbe solo che le normali procedure di inferenza non funzionano
Repmat,

L'eteroscedasticità appiattisce la pendenza, anche se un outlier lo correggesse, la penalità consisterebbe in ampi intervalli di confidenza e un modello scadente. Non userei un tale modello, ma, sì, si possono fare modelli schifosi. La letteratura medica ne è piena.
Carl,

La prima parte del tuo commento è semplicemente sbagliata. Non sono nemmeno sicuro di cosa significhi.
Repmat,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.