Quando i modelli lineari impropri diventano belli in modo robusto?


9

Domande:

  • I modelli lineari impropri sono usati nella pratica o sono qualche tipo di curiosità descritta di volta in volta nelle riviste scientifiche? In tal caso, in quali settori vengono utilizzati?
  • Ci sono altri esempi di tali modelli?
  • Infine, gli errori standard, i valori , ecc. Presi da OLS per tali modelli sarebbero corretti o dovrebbero essere corretti in qualche modo?pR2

Contesto: nella letteratura vengono descritti di volta in volta modelli lineari impropri. In generale, tali modelli possono essere descritti come

y=un'+BΣiowioXio+ε

ciò che li rende diversi dalla regressione è che i non sono coefficienti stimati nel modello, ma sono pesi che sonowj

  • uguale per ogni variabile ( regressione ponderata per unità ),wio=1
  • basato sulle correlazioni (Dana e Dawes, 2004),wio=ρ(y,Xio)
  • scelto a caso (Dawes, 1979),
  • -1 per variabili correlate negativamente a , per variabili positivamente correlate a (Wainer, 1976).y1y

Inoltre è comune utilizzare una sorta di ridimensionamento delle funzionalità, come la conversione di variabili in punteggiQuindi, questo tipo di modello può essere semplificato per la regressione lineare univariataZ

y=un'+Bv+ε

dove e può essere semplicemente stimato utilizzando la regressione OLS.v=ΣwioX

Riferimenti:
Dawes, Robyn M. (1979). La solida bellezza di modelli lineari impropri nel processo decisionale . Psicologo americano, 34, 571-582.

Graefe, A. (2015). Miglioramento delle previsioni utilizzando predittori equamente ponderati . Journal of Business Research, 68 (8), 1792-1799.

Wainer, Howard (1976). Stima dei coefficienti nei modelli lineari: non fa nulla . Bollettino psicologico 83 (2), 213.

Dana, J. e Dawes, RM (2004). La superiorità delle semplici alternative alla regressione per le previsioni di scienze sociali . Journal of Educational and Behavioural Statistics, 29 (3), 317-331.


3
In che senso le statistiche derivate da questi modelli sarebbero "errate"?
whuber

1
wioBywio

1
Non è stato un commento informato: i documenti sono ancora sulla mia pila "da leggere". Mi chiedevo solo: - "perché 'improprio'?". Non è insolito che un predittore sia una combinazione lineare di altre variabili: una media di diverse misurazioni, un punteggio del componente principale, una previsione da un'altra regressione, il livello da una serie temporale levigata in modo esponenziale o un valore calcolato da un consolidato o un indice ad hoc. La mancata stima dei pesi dalla risposta risparmia i gradi di libertà, contribuendo ad evitare un eccesso di adattamento con campioni di dimensioni inferiori.
Scortchi - Ripristina Monica

1
XiowioXio

4
wio=ρ(y,Xio)ρ

Risposte:


1

In effetti, mi sembra che questo sia un assortimento di presunte strutture di covarianza. In altre parole, questo è un tipo di modellazione precedente bayesiana.

|β^|<|β|R^2<R2

La mia esperienza personale è che il superiore dell'approccio bayesiano è usare una migliore modellistica; trasformare i parametri, usare altre norme e / o usare metodi non lineari. Cioè, una volta che la fisica del problema e i metodi sono adeguatamente esplorati e coordinati, le statistiche F, il coefficiente di determinazione, ecc. Migliorano piuttosto che degradare.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.