Non ho in mente un esempio o un compito specifico. Sono appena nuovo sull'uso di b-splines e volevo capire meglio questa funzione nel contesto della regressione.
Supponiamo di voler valutare la relazione tra la variabile di risposta e alcuni predittori . I predittori includono alcune variabili numeriche e anche alcune categoriali.
Diciamo che dopo aver inserito un modello di regressione, una delle variabili numeriche, ad esempio è significativa. Un passo logico in seguito è valutare se sono necessari polinomi di ordine superiore, ad esempio: e per spiegare adeguatamente la relazione senza un eccesso di adattamento.
Le mie domande sono:
A che punto hai scelto tra le b-spline o il semplice polinomio di ordine superiore. ad es. in R:
y ~ poly(x1,3) + x2 + x3
vs
y ~ bs(x1,3) + x2 + x3
Come puoi usare i grafici per informare la tua scelta tra quei due e cosa succede se non è davvero chiaro dai grafici (ad es. A causa di enormi quantità di punti dati)
Come valuteresti i termini di interazione bidirezionale tra e diciamo
In che modo cambia quanto sopra per diversi tipi di modelli
Considereresti di non usare mai polinomi di alto ordine e di montare sempre b-spline e penalizzare l'elevata flessibilità?
mgcv
, perché non usare modelli additivi (generalizzati). La selezione della scorrevolezza è automatica e i metodi inferenziali sono ben sviluppati.