Qualcuno può spiegarmi la reale differenza (s) tra analisi di regressione e adattamento della curva (lineare e non lineare), con un esempio se possibile?
Sembra che entrambi provino a trovare una relazione tra due variabili (dipendente vs indipendente) e quindi determinino il parametro (o coefficiente) associato ai modelli proposti. Ad esempio, se ho un set di dati come:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Qualcuno può suggerire una formula di correlazione tra queste due variabili? Ho difficoltà a comprendere la differenza tra questi due approcci. Se preferisci supportare la tua risposta con altri set di dati, è OK poiché quello sembra difficile da adattare (forse solo per me).
L'insieme di dati di cui sopra rappresenta il ed y assi di una caratteristica di funzionamento ricevitore curva (ROC), dove y è il vero tasso positivo (TPR) e x è la percentuale di falsi positivi (FPR).
Sto cercando di adattare una curva, o fare un'analisi di regressione secondo la mia domanda originale, non sono ancora sicuro, tra questi punti per stimare il TPR per qualsiasi FPR particolare (o viceversa).
Primo, è scientificamente accettabile trovare una tale funzione di adattamento alla curva tra due variabili indipendenti (TPR e FPR)?
In secondo luogo, è scientificamente accettabile trovare una tale funzione se so che le distribuzioni dei casi positivi e negativi effettivi non sono normali?