Qualcuno può aiutare a dare una spiegazione concettuale di come vengono fatte le previsioni per i nuovi dati quando si utilizzano smooths / spline per un modello predittivo? Ad esempio, dato un modello creato usando gamboost
nel mboost
pacchetto in R, con p-splines, come vengono fatte le previsioni per i nuovi dati? Cosa viene utilizzato dai dati di allenamento?
Supponiamo che ci sia un nuovo valore della variabile indipendente x e che vogliamo prevedere y. Una formula per la creazione di spline viene applicata a questo nuovo valore di dati usando i nodi o df utilizzati durante l'addestramento del modello e quindi i coefficienti del modello addestrato vengono applicati per produrre la previsione?
Ecco un esempio con R, cosa sta facendo la previsione concettualmente per produrre 899.4139 per i nuovi dati mean_radius = 15.99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)