Penso che la parte cruciale da considerare nel rispondere alla tua domanda sia
Sto cercando di identificare il modello migliore per prevedere i prezzi delle automobili
perché questa affermazione implica qualcosa sul perché si desidera utilizzare il modello. La scelta e la valutazione del modello dovrebbero basarsi su ciò che si desidera ottenere con i valori adattati.
In primo luogo, permette di ricapitolare ciò che faR2 : Si calcola una misura in scala in base alla funzione di perdita quadratica, e sono sicuro che sei già a conoscenza. Per vedere questo, definire residuo per la i-esima osservazione y i ed il corrispondente valore adattato y i . Usando la notazione conveniente S S R : = ∑ N i = 1 e 2 i , S S T : = ∑ei=yi−y^iyiy^iSSR:=∑Ni=1e2i,R2è semplicemente definito comeR2=1-SSR/SST.SST:=∑Ni=1(yi−y¯)2R2R2=1−SSR/SST
In secondo luogo, vediamo cosa significa usare per la scelta / valutazione del modelloR2 . Supponiamo di scegliere tra una serie di previsioni che sono state generate utilizzando un modello M : M ∈ M , dove M è la raccolta di modelli in esame (nel tuo esempio, questa raccolta conterrebbe reti neurali, foreste casuali, reti elastiche, ...). Dal momento che S S T rimarrà costante tra tutti i modelli, se minimizzando R 2 potrete scegliere esattamente il modello che minimizza S S R . In altre parole, sceglieraiY¯MM:M∈MMSSTR2SSR che produce la minima perdita di errore quadrata!M∈M
Terzo, consideriamo perché R2 o equivalentemente, potrebbe essere interessante per la scelta del modello . Tradizionalmente, la perdita quadrata ( norma L 2 ) viene utilizzata per tre motivi: (1) È calcolabile più facilmente delle deviazioni assolute minime (LAD, norma L 1 ) perché non compaiono valori assoluti nel calcolo, (2) punisce adattato valori che sono molto lontani dal valore reale molto più di LAD (in un quadrato piuttosto che in un senso assoluto) e quindi si assicurano che abbiamo valori anomali meno estremi, (3) è simmetrico : sovrastimare o sottovalutare il prezzo di un'auto è considerato ugualmente cattivo.SSR L2L1
Quarto (e ultimo), vediamo se questo è ciò di cui hai bisogno per le tue previsioni. Il punto che potrebbe essere di maggiore interesse qui è (3) dall'ultimo paragrafo. Supponiamo di voler assumere una posizione neutrale e di non essere né acquirente né venditore di un'auto. Quindi, può avere un senso: sei imparziale e desideri punire le deviazioni in eccesso o sottovalutazione esattamente in modo identico. Lo stesso vale se si desidera solo modellare la relazione tra le quantità senza voler prevedere valori non osservati. Supponiamo ora di lavorare per un consumatore / acquirente con un budget limitato: in questa situazione, potresti voler punire la sopravvalutazione del prezzo in senso quadratico, ma la sottovalutazione in senso L p , dove 1 ⩽ pR2Lp . Per p = 1 , puniresti in un senso di deviazione assoluta. Questo può essere visto per riflettere gli obiettivi e le intenzioni dell'acquirente e distorcere la stima al ribasso potrebbe essere di interesse per lui / lei. Al contrario, potresti capovolgere il pensiero se dovessi modellare le previsioni di prezzo per il venditore. Inutile dire che qualsiasi norma L p potrebbe essere scelta per riflettere le preferenze del modellista / agente per il quale si modella. Puoi anche punire completamente al di fuori dellanorma L p e usare una perdita costante, esponenziale o di log da un lato e una perdita diversa dall'altro.1⩽p<2p=1LpLp
In sintesi, la scelta / valutazione del modello non può essere considerata indipendentemente dall'obiettivo del modello.