Il motivo per cui le trame sono universalmente utilizzate per introdurre una semplice regressione - una risposta prevista da un singolo predittore - è che aiutano a capire.
Tuttavia, credo di poter dare qualcosa del sapore che potrebbe aiutare a capire cosa sta succedendo. In questo mi concentrerò principalmente sul tentativo di trasmettere parte della comprensione che danno, il che può aiutare con alcuni degli altri aspetti che incontrerai in genere nella lettura della regressione. Quindi questa risposta affronterà principalmente un aspetto particolare del tuo post.
Immagina di essere seduto di fronte a un grande tavolo rettangolare come una semplice scrivania da ufficio, uno lungo un braccio (forse 1,8 metri), forse la metà così largo.
Ti siedi davanti al tavolo nella solita posizione, nel mezzo di un lato lungo. Su questo tavolo un gran numero di unghie (con teste abbastanza lisce) sono state martellate nella superficie superiore in modo che ognuna sporga un po '(abbastanza per sentire dove si trovano e abbastanza per legare una corda o attaccare un elastico ).
Questi chiodi si trovano a varie distanze dal bordo della scrivania, in modo tale che verso un'estremità (diciamo l'estremità sinistra) siano in genere più vicini al bordo della scrivania e quindi mentre si spostano verso l'altra estremità le teste delle unghie tende ad essere più lontano dal tuo limite.
Immagina inoltre che sarebbe utile avere un'idea di quanto in media le unghie siano dal tuo bordo in qualsiasi posizione lungo il tuo bordo.
Scegli un posto lungo il bordo della scrivania e posiziona la mano lì, quindi allunga la mano in avanti direttamente attraverso il tavolo, trascinando delicatamente la mano direttamente indietro verso di te, quindi allontanandola di nuovo, spostando la mano avanti e indietro sulle teste delle unghie. Incontrate diverse dozzine di protuberanze da queste unghie - quelle all'interno di quella stretta larghezza della mano (mentre si allontana direttamente dal bordo, a distanza costante dall'estremità sinistra della scrivania), una sezione o una striscia, larga circa dieci centimetri .
L'idea è quella di capire una distanza media di un chiodo dal bordo della scrivania in quella piccola sezione. Intuitivamente è solo la metà dei dossi che colpiamo, ma se misurassimo ogni distanza da un chiodo in quella sezione larga della scrivania, potremmo calcolare facilmente quelle medie.
Ad esempio, potremmo usare un quadrato a T la cui testa scivola lungo il bordo della scrivania e il cui asta corre verso l'altro lato della scrivania, ma appena sopra la scrivania in modo da non colpire i chiodi mentre scivola a sinistra o a destra - quando passiamo un determinato chiodo possiamo ottenere la sua distanza lungo l'albero del quadrato a T.
Quindi, a una progressione di posti lungo il nostro bordo, ripetiamo questo esercizio di trovare tutte le unghie in una striscia di larghezza della mano che corre verso e lontano da noi e di trovare la loro distanza media. Forse dividiamo la scrivania in strisce larghe a mano lungo il bordo (quindi ogni chiodo si incontra esattamente in una striscia).
Ora immagina che dicessero 21 strisce di questo tipo, la prima sul bordo sinistro e l'ultima sul bordo destro. I mezzi si allontanano ulteriormente dalla nostra scrivania mentre avanziamo attraverso le strisce.
Questi mezzi formano un semplice stimatore della regressione non parametrica dell'aspettativa di y (la nostra distanza) data x (distanza lungo il nostro bordo dall'estremità sinistra), cioè E (y | x). In particolare, si tratta di uno stimatore della regressione non parametrica, chiamato anche regressogramma
Se quelle strisce significano un aumento regolare - cioè, la media stava generalmente aumentando di circa la stessa quantità per striscia di come ci siamo spostati attraverso le strisce - allora potremmo meglio stimare la nostra funzione di regressione assumendo che il valore atteso di y fosse un lineare funzione di x - ovvero che il valore atteso di y dato x fosse una costante più un multiplo di x. Qui la costante rappresenta dove le unghie tendono a trovarsi quando a x è zero (spesso potremmo posizionarlo all'estremità sinistra ma non deve essere), e il multiplo particolare di x è la velocità media media cambia mentre ci spostiamo di un centimetro (diciamo) a destra.
Ma come trovare una funzione così lineare?
Immagina di avvolgere un elastico su ogni testa di unghia e di attaccare ciascuno a un lungo bastone sottile che si trova appena sopra la scrivania, sopra le unghie, in modo che si trovi da qualche parte vicino al "centro" di ogni striscia che eravamo stati per.
Fissiamo le fasce in modo tale che si estendano solo nella direzione verso e lontano da noi (non a sinistra o a destra) - a sinistra a se stesse si tirerebbero in modo da fare la loro direzione di allungamento ad angolo retto con il bastone, ma qui lo impediamo, in modo che la loro direzione di allungamento rimanga solo nelle direzioni verso o lontano dal nostro bordo della scrivania. Ora lasciamo che il bastoncino si stabilizzi mentre le fasce lo tirano verso ogni unghia, con chiodi più distanti (con elastici più allungati) che tirano corrispondentemente più duramente rispetto ai chiodi vicino al bastoncino.
Quindi il risultato combinato di tutte le fasce che tirano il bastone sarebbe (idealmente, almeno) di tirare il bastone per minimizzare la somma delle lunghezze quadrate degli elastici allungati; in quella direzione direttamente attraverso il tavolo, la distanza dal nostro bordo del tavolo allo stick in una data posizione x sarebbe la nostra stima del valore atteso di y dato x.
Questa è essenzialmente una stima di regressione lineare.
Ora, immagina che al posto delle unghie abbiamo molti frutti (come forse piccole mele) che pendono da un grande albero e desideriamo trovare la distanza media dei frutti dal suolo poiché varia con la posizione sul terreno. Immagina che in questo caso le altezze dal suolo aumentano man mano che andiamo avanti e leggermente più grandi quando ci muoviamo a destra, sempre in modo regolare, quindi ogni passo in avanti generalmente cambia l'altezza media di circa la stessa quantità, e ogni passo verso il right cambierà anche la media di un valore approssimativamente costante (ma questa quantità di cambiamento nella media che fa un passo avanti è diversa dalla quantità di cambiamento che fa un passo avanti).
Se minimizziamo la somma delle distanze verticali quadrate dai frutti su un foglio piatto sottile (forse un foglio sottile di plastica molto rigida) per capire come cambia l'altezza media mentre ci muoviamo in avanti o avanziamo a destra, sarebbe una regressione lineare con due predittori: una regressione multipla.
Questi sono gli unici due casi che le trame possono aiutare a capire (possono mostrare rapidamente ciò che ho appena descritto a lungo, ma speriamo che tu abbia una base su cui concettualizzare le stesse idee). Al di là di questi due casi più semplici, ci resta solo la matematica.
Ora prendi il tuo esempio di prezzo della casa; puoi rappresentare l'area di ogni casa a una distanza lungo il bordo della scrivania - rappresentare la dimensione della casa più grande come una posizione vicino al bordo destro, ogni altra dimensione della casa sarà una posizione più a sinistra dove un certo numero di centimetri rappresenterà un po ' numero di metri quadri. Ora la distanza rappresenta il prezzo di vendita. Rappresenta la casa più costosa come una certa distanza particolare vicino al bordo più lontano della scrivania (come sempre, il bordo più lontano dalla tua sedia), e ogni centimetro spostato rappresenterà un certo numero di Rial.
Per il momento immagina di aver scelto la rappresentazione in modo che il bordo sinistro della scrivania corrisponda a un'area della casa pari a zero e il bordo vicino a un prezzo della casa pari a 0. Abbiamo quindi inserito un chiodo per ogni casa.
Probabilmente non avremo alcun chiodo vicino all'estremità sinistra del bordo (potrebbero essere principalmente verso destra e lontano da noi) perché questa non è necessariamente una buona scelta di scala ma la tua scelta di un modello senza intercettazione rende questo un modo migliore per discuterne.
Ora nel tuo modello costringi il bastone a passare attraverso un anello di stringa nell'angolo sinistro del bordo vicino della scrivania - costringendo così il modello montato ad avere un prezzo zero per l'area zero, che potrebbe sembrare naturale - ma immagina se ci sono alcune componenti del prezzo abbastanza costanti che hanno influenzato ogni vendita. Quindi avrebbe senso avere l'intercetta diversa da zero.
In ogni caso, con l'aggiunta di quel ciclo, lo stesso esercizio con l'elastico di prima troverà la nostra stima dei minimi quadrati della linea.