È una buona domanda, perché "quantità diverse" non sembrano essere una spiegazione.
Ci sono due motivi importanti per diffidare dell'uso di per confrontare questi modelli: è troppo grezzo ( non valuta davvero la bontà dell'adattamento ) e sarà inappropriato per almeno uno dei modelli. Questa risposta affronta quel secondo problema.R2
Trattamento teorico
R 2 yR2 confronta la varianza dei residui del modello con la varianza delle risposte. La varianza è una deviazione additiva quadrata media da un adattamento. Pertanto, possiamo comprendere come confronto tra due modelli di risposta . R2y
Il modello "base" è
yio= μ + δio(1)
dove è un parametro (la risposta media teorica) e sono "errori" casuali indipendenti, ciascuno con media zero e una varianza comune di .δ i τ 2μδioτ2
Il modello di regressione lineare introduce i vettori come variabili esplicative:Xio
yio= β0+ xioβ+ εio.(2)
Il numero e il vettore sono i parametri (l'intercetta e le "pendenze"). Di nuovo ε i sono errori casuali indipendenti, ciascuno con media zero e varianza comune σ 2 . ββ0βεioσ2
stima la riduzione della varianza, τ 2 - σ 2 , rispetto alla varianza originale τ 2 .R2τ2- σ2τ2
Quando si prendono i logaritmi e si usano i minimi quadrati per adattarsi al modello , si sta implicitamente confrontando una relazione del modulo
log( yio) = ν+ ζio(1a)
a uno dei moduli
log( yio) = γ0+ xioγ+ ηio.(2a)
Questi sono proprio come i modelli e ( 2 ) ma con le risposte del registro. Tuttavia, non equivalgono ai primi due modelli. Ad esempio, esponenziando entrambi i lati di ( 2 a ) darebbe( 1 )( 2 )( 2 a )
yi=exp(log(yi))=exp(γ0+xiγ)exp(ηi).
I termini di errore ora moltiplicano la relazione sottostante y i = exp ( γ 0 + x i γ ) . Di conseguenza, le varianze delle risposte sonoexp(ηi)yi=exp(γ0+xiγ)
Var(yi)=exp(γ0+xiγ)2Var(eηi).
Le varianze dipendono dalla . Xio Questo non è il modello , che suppone che le varianze siano tutte uguali a una costante σ 2 .( 2 )σ2
Di solito, solo una di queste serie di modelli può essere una descrizione ragionevole dei dati. Applicare il secondo set e ( 2 a ) quando il primo set ( 1 ) e ( 2 ) è un buon modello, o il primo quando il secondo è buono, equivale a lavorare con un set di dati eteroscedastico non lineare, che pertanto dovrebbe adattarsi male a una regressione lineare. Quando una di queste situazioni è il caso, potremmo aspettarci che il modello migliore mostri l' R 2 più grande . Tuttavia, che dire se non è nemmeno il caso? Possiamo ancora aspettarci il più grande( 1 a )( 2 a )( 1 )( 2 )R2 per aiutarci a identificare il modello migliore?R2
Analisi
In un certo senso questa non è una buona domanda, perché se nessuno dei due modelli è appropriato, dovremmo trovare un terzo modello. Tuttavia, il problema che ci attende riguarda l'utilità di nell'aiutarci a prendere questa decisione. Inoltre, molte persone pensare prima la forma del rapporto tra x ed y --is è lineare, è esso logaritmica, è qualcos'altro - senza preoccuparsi sulle caratteristiche degli errori di regressione ε i o η i . Consideriamo quindi una situazione in cui il nostro modello ottiene la relazione giusta ma ha torto sulla sua struttura di errore, o viceversa .R2Xyεioηio
Tale modello (che si verifica comunemente) è un minimo quadrato adatto a una relazione esponenziale,
yio= exp( α0+ xioα ) + θio.(3)
Ora il logaritmo di è una funzione lineare di x , come in ( 2 a ) , ma i termini di errore θ i sono additivi , come in ( 2 ) . In questi casi R 2 noi potrebbe indurre in errore nella scelta del modello con il rapporto sbagliato tra x e y .yX( 2 a )θio( 2 )R2Xy
Ecco un'illustrazione del modello . Ci sono 300 osservazioni per x i (un vettore vettoriale equamente distribuito tra 1.0 e 1.6 ). Il pannello di sinistra mostra i dati originali ( x , y ) mentre il pannello di destra mostra i dati trasformati ( x , log ( y ) ) . Le linee rosse tratteggiate tracciano la vera relazione sottostante, mentre le linee blu continue mostrano gli accoppiamenti dei minimi quadrati. I dati e la vera relazione sono gli stessi in entrambi i pannelli: solo i modelli e le loro misure differiscono.( 3 )300Xio1.01.6( x , y)( x , registro( y) )

R20,700.56R2R20,70
log( y)( 3 )