Differenza tra analisi di regressione e adattamento della curva


17

Qualcuno può spiegarmi la reale differenza (s) tra analisi di regressione e adattamento della curva (lineare e non lineare), con un esempio se possibile?

Sembra che entrambi provino a trovare una relazione tra due variabili (dipendente vs indipendente) e quindi determinino il parametro (o coefficiente) associato ai modelli proposti. Ad esempio, se ho un set di dati come:

Y = [1.000 1.000 1.000 0.961 0.884 0.000] 
X = [1.000 0.063 0.031 0.012 0.005 0.000]

Qualcuno può suggerire una formula di correlazione tra queste due variabili? Ho difficoltà a comprendere la differenza tra questi due approcci. Se preferisci supportare la tua risposta con altri set di dati, è OK poiché quello sembra difficile da adattare (forse solo per me).

L'insieme di dati di cui sopra rappresenta il ed y assi di una caratteristica di funzionamento ricevitore curva (ROC), dove y è il vero tasso positivo (TPR) e x è la percentuale di falsi positivi (FPR).xyyx

Sto cercando di adattare una curva, o fare un'analisi di regressione secondo la mia domanda originale, non sono ancora sicuro, tra questi punti per stimare il TPR per qualsiasi FPR particolare (o viceversa).

Primo, è scientificamente accettabile trovare una tale funzione di adattamento alla curva tra due variabili indipendenti (TPR e FPR)?

In secondo luogo, è scientificamente accettabile trovare una tale funzione se so che le distribuzioni dei casi positivi e negativi effettivi non sono normali?


1
I termini sono (purtroppo) usati in modo diverso da persone diverse e in contesti diversi. Puoi collegarti a / fornire un esempio in cui le persone si distinguono tra loro?
gung - Ripristina Monica

Questo è quello che sto cercando di capire, come sono diversi e come posso distinguerli.
Ali Sultan,

1
Abbastanza giusto, ma qualcuno ti ha detto che avrebbero dovuto essere diversi?
gung - Ripristina Monica

2
In questo sito alcune persone hanno usato "adattamento alla curva" in sensi che non possono essere considerati regressione. Ad esempio, alcuni di essi considerano la stima di una densità come una forma di "adattamento della curva" a un istogramma.
whuber

Risposte:


22

Dubito che vi sia una chiara e coerente distinzione tra scienze e campi statisticamente distinti tra regressione e adattamento alla curva .

La regressione senza qualifica implica regressione lineare e stima dei minimi quadrati. Ciò non esclude altri o più ampi sensi: infatti una volta che si consente logit, Poisson, regressione binomiale negativa, ecc. Ecc., Diventa più difficile vedere quale modello non è regressione in un certo senso.

L'adattamento alla curva suggerisce letteralmente una curva che può essere disegnata su un piano o almeno in uno spazio a bassa dimensione. La regressione non è così limitata e può prevedere le superfici in uno spazio di diverse dimensioni.

L'adattamento alla curva può o meno utilizzare la regressione lineare e / o i minimi quadrati. Potrebbe riferirsi all'adattamento di un polinomio (serie di potenze) o ad un insieme di termini seno e coseno o in qualche altro modo effettivamente qualificato come regressione lineare nel senso chiave del montaggio di una forma funzionale lineare nei parametri. Effettivamente adattamento alla curva quando anche la regressione non lineare è regressione.

Il termine adattamento alla curva potrebbe essere usato in un senso denigratorio, dispregiativo, deprecatorio o sprezzante ("questo è solo adattamento alla curva!") O (quasi l'esatto contrario) potrebbe riferirsi all'adattamento di una curva specifica scelta con cura con uno specifico fisico (biologico, economico, qualunque sia) razionale o su misura per abbinare particolari tipi di comportamento iniziale o limitante (ad esempio, essere sempre positivo, limitato in una o entrambe le direzioni, monotono, con un'inflessione, con un singolo punto di svolta, oscillatorio, ecc.).

Uno dei numerosi problemi sfocati qui è che la stessa forma funzionale può essere nella migliore delle ipotesi empirica in alcune circostanze e teoria eccellente in altre. Newton ha insegnato che le traiettorie dei proiettili possono essere paraboliche e quindi naturalmente adattate dalla quadratica, mentre una quadratica adattata alla dipendenza dall'età nelle scienze sociali è spesso solo una sfumatura che corrisponde a una curvatura dei dati. Il decadimento esponenziale è una buona approssimazione per gli isotopi radioattivi e un'ipotesi a volte non troppo folle per il modo in cui i valori della terra diminuiscono con la distanza da un centro.

Il tuo esempio non ottiene ipotesi esplicite da me. Gran parte del punto qui è che con un set di dati molto piccolo e precisamente nessuna informazione su quali siano le variabili o su come dovrebbero comportarsi potrebbe essere irresponsabile o sciocco suggerire un modello. Forse i dati dovrebbero aumentare nettamente da (0, 0) e quindi avvicinarsi (1, 1), o forse qualcos'altro. Ditecelo!

Nota. Né la regressione né l'adattamento alla curva sono limitati a singoli predittori o singoli parametri (coefficienti).


2
"Curve-fitting" connota qualcosa di teorico (es. Lowess) per me. Gli economisti a volte deridono una funzione teorica che si adatta come "rappresentazione grafica", che suona in modo simile ad alcuni usi dell'adattamento alla curva. Penso che (es. Lowess) abbia sia pro che contro, se capito correttamente. È difficile sapere come qualcuno intendesse chiaramente i termini senza più contesto.
gung - Ripristina Monica

1
@gung Penso che ci sia un uso simile in parte giocoso, in parte grave in diverse scienze naturali (e innaturali). Uno dei problemi è che, dati i parametri sufficienti, hai necessariamente un sacco di spazio di manovra. Mi vengono in mente modelli di serie storiche che consentono non solo ARIMA ma anche termini e passaggi sinusoidali, rampe e picchi ovunque suggeriscano i dati.
Nick Cox,

In secondo luogo @gung, l'adattamento alla curva ha una connotazione più non parametrica, almeno per me.
Christoph Hanck,

1
@ChristophHanck Per favore non portare "non parametrico" in questo! La discussione è già abbastanza fangosa!
Nick Cox,

1
@gung: Pensando a levigare le spline e i metodi RKHS in generale come la spina dorsale del "adattamento alla curva", ad esempio, sento che "adattamento alla curva" sia molto più teorico della "regressione". (+1 a NickCox per questa risposta)
usεr11852 afferma Reinstate Monic

8

Oltre all'eccellente risposta di @ NickCox (+1), volevo condividere la mia impressione soggettiva su questo argomento terminologico un po 'confuso . Penso che una differenza piuttosto sottile tra i due termini risieda nel seguente. Da un lato, la regressione spesso, se non sempre, implica una soluzione analitica (il riferimento ai regressori implica la determinazione dei loro parametri , quindi la mia argomentazione sulla soluzione analitica). D'altra parte, l' adattamento alla curva non implica necessariamente la produzione di una soluzione analitica e l'IMHO spesso potrebbe essere ed è utilizzato come approccio esplorativo .


2
Non è possibile utilizzare qualcosa con una soluzione analitica anche per motivi esplorativi? Non credo di avere l'opposizione che stai facendo.
ameba dice di reintegrare Monica

@amoeba: le soluzioni analitiche possono certamente essere utilizzate anche per la ricerca esplorativa. Tuttavia, il punto che sto sollevando riguarda l' essenza implicita più popolare dei termini in questione.
Aleksandr Blekh,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.