Contesto:
Da una domanda su Mathematics Stack Exchange (posso creare un programma) , qualcuno ha una serie di punti e vuole adattarci una curva, lineare, esponenziale o logaritmica. Il solito metodo è iniziare scegliendo uno di questi (che specifica il modello), quindi eseguire i calcoli statistici.
Ma ciò che si vuole veramente è trovare la curva "migliore" tra lineare, esponenziale o logaritmica.
Apparentemente, si potrebbero provare tutti e tre e scegliere la curva più adatta dei tre in base al miglior coefficiente di correlazione.
Ma in qualche modo sento che non è del tutto kosher. Il metodo generalmente accettato è quello di scegliere prima il modello, uno di quei tre (o qualche altra funzione di collegamento), quindi dai dati calcolare i coefficienti. E la raccolta post facto è la raccolta delle ciliegie. Ma per me se stai determinando una funzione o coefficienti dai dati è sempre la stessa cosa, la tua procedura sta scoprendo la cosa migliore ... (diciamo che quale funzione è anche un altro coefficiente o essere scoperto).
Domande:
- È appropriato scegliere il modello più adatto tra i modelli lineari, esponenziali e logaritmici, sulla base di un confronto delle statistiche di adattamento?
- In tal caso, qual è il modo più appropriato per farlo?
- Se la regressione aiuta a trovare i parametri (coefficienti) in una funzione, perché non può esserci un parametro discreto per scegliere da quale delle tre famiglie di curve verrà la migliore?