Sono curioso di sapere procedure ripetibili che possono essere utilizzati per scoprire la forma funzionale della funzione y = f(A, B, C) + error_term
in cui il mio unico input è un insieme di osservazioni ( y
, A
, B
e C
). Si noti che la forma funzionale di f
è sconosciuta.
Considera il seguente set di dati:
AA BB CC DD EE FF == == == == == == 98 11 66 84 67 10500 71 44 48 12 47 7250 54 28 90 73 95 5463 34 95 15 45 75 2581 56 37 0 79 43 3221 68 79 1 65 9 4721 53 2 90 10 18 3095 38 75 41 97 40 4558 29 99 46 28 96 5336 22 63 27 43 4 2196 4 5 89 78 39 492 10 28 39 59 64 1178 11 59 56 25 5 3418 10 4 79 98 24 431 86 36 84 14 67 10526 80 46 29 96 7 7793 67 71 12 43 3 5411 14 63 2 9 52 368 99 62 56 81 26 13334 56 4 72 65 33 3495 51 40 62 11 52 5178 29 77 80 2 54 7001 42 32 4 17 72 1926 44 45 30 25 5 3360 6 3 65 16 87 288
In questo esempio, supponiamo che lo sappiamo FF = f(AA, BB, CC, DD, EE) + error term
, ma non siamo sicuri della forma funzionale di f(...)
.
Quale procedura / quali metodi useresti per arrivare a trovare la forma funzionale di f(...)
?
(Punto bonus: qual è la tua ipotesi migliore alla conclusione di aver f
dato i dati sopra? :-) E sì, c'è una risposta "corretta" che produrrà un R^2
eccesso di 0,99.)
R^2 >= 0.99
uno vorrebbe trovare quello con il miglior rapporto prestazioni / complessità (e naturalmente fuori misura). Scusate se non ho scritto quella
FF
è stata "resa di combustione" eAA
fu quantità di carburante, edBB
è stata la quantità di ossigeno, si dovrebbe guardare per una durata di interagireAA
eBB