Mi sono imbattuto in una semplice domanda sul confronto tra modelli flessibili (ad esempio spline) e modelli non flessibili (ad esempio regressione lineare) in diversi scenari. La domanda è:
In generale, prevediamo che le prestazioni di un metodo di apprendimento statistico flessibile funzionino meglio o peggio di un metodo non flessibile quando:
- Il numero di predittori è estremamente elevato e il numero di osservazioni è piccolo?
- La varianza dei termini di errore, ovvero , è estremamente elevata?
Penso per (1), quando è piccolo, i modelli non flessibili sono migliori (non sono sicuro). Per (2), non so quale modello sia (relativamente) migliore.