Perché i problemi di regressione sono chiamati problemi di "regressione"?


Risposte:


34

Il termine "regressione" fu usato da Francis Galton nel suo documento del 1886 "Regressione verso la mediocrità nella statura ereditaria". Per quanto ne so, ha usato il termine solo nel contesto della regressione verso la media . Il termine è stato poi adottato da altri per ottenere più o meno il significato che ha oggi come metodo statistico generale.


15
Galton ha ricavato un'approssimazione lineare per stimare l'altezza di un figlio dall'altezza del padre in quel foglio. La sua equazione è stata adattata in modo che un padre di altezza media avrebbe un figlio di altezza media, ma un padre più alto della media avrebbe un figlio che è più alto della media di 2/3 della quantità di suo padre. Lo stesso con più breve della media. Questo potrebbe essere considerato una semplice regressione lineare (significato di oggi). E naturalmente oggi la regressione ha un significato ancora più ampio: è qualsiasi modello che fa previsioni continue. È interessante quanto sia cambiato il suo uso originale di quella parola.
rm999,

3
La risposta di NRH è corretta. Il seguente link fornisce molti più dettagli sull'articolo di Francis Galton "Regressione verso la mediocrità nella statura ereditaria" blog.minitab.com/blog/statistics-and-quality-data-analysis/…
Gaurav Singhal

è tempo che la comunità statistica sostituisca la parola "regressione" con un termine più semplice e chiaro, forse "predittore formulaico"?
Aviad Rozenhek,

4

Al contrario del progresso, stiamo tornando alla media, cioè regredendo. Da qui il termine regressione! Penso che sia qualcosa che è stato raccolto e bloccato.


2

@Mark White ha già menzionato il link, ma per quelli di voi che non hanno molto tempo per controllare il link, ecco la risposta esatta con riferimento corretto:

Origine della 'regressione'

Il termine "regressione" fu coniato da Francis Galton nel 19 ° secolo per descrivere un fenomeno biologico. Il fenomeno era che le altezze dei discendenti di antenati tendono a regredire verso una media normale (un fenomeno noto anche come regressione verso la media) (Galton, ristampato nel 1989). Per Galton, la regressione aveva solo questo significato biologico (Galton, 1887) , ma il suo lavoro fu successivamente esteso da Udny Yule e Karl Pearson a un contesto statistico più generale (Pearson, 1903).

Riferimenti

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Leggi tipiche dell'ereditarietà. III. Natura, 15 (389), 512-514.

Galton, F. (ristampato 1989). La parentela e la correlazione. Statistical Science, 4 (2), 80–86.

Pearson, K. (1903). La legge dell'eredità ancestrale. Biometrika, 2 (2), 211-228.


La regressione di Galton come nella "regressione alla media" ha senso. tuttavia non capisco l'uso della parola "regressione" per indicare "imparare una formula da variabili indipendenti a una variabile di risultato"
Aviad Rozenhek,

1
Più in generale significa che, ma l'apprendimento automatico utilizza la regressione, ma la regressione non è una tecnica di apprendimento automatico, nonostante l'opinione popolare e errata. L'apprendimento statistico è separato dall'apprendimento automatico, ma in generale i sostenitori della ML adottano metodi statistici e li etichettano erroneamente come ML in modo da far apparire le apparenti incongruenze. La regressione di Galton è la regressione; ha a che fare con la modellazione / previsione di una tendenza.
LSC,

0

La "regressione" deriva dal "regresso" che a sua volta deriva dal "regresso" latino - per tornare indietro (a qualcosa).

In tal senso, la regressione è la tecnica che consente di "tornare indietro" da dati disordinati, difficili da interpretare, a un modello più chiaro e significativo. Come fisico, mi piace l'idea, poiché i fisici vedono i fenomeni naturali come i molteplici possibili risultati di una legge naturale relativamente semplice.

In altre parole, la parola regressione sembra suggerire che i dati sono solo l'effetto visibile e tangibile di un "modello statistico". In altre parole, il modello viene prima di tutto e il tuo desiderio è usare i dati "per tornare" a ciò che li ha originati.


0

Come so la parola regressionnel significato statistico è la misurazione della relazione tra il valore medio di una variabile e i corrispondenti valori di altre variabili.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.