Penso che le risposte precedenti facciano un buon lavoro nel formulare punti importanti:
- I modelli parsimoniosi tendono ad avere migliori caratteristiche di generalizzazione.
- La parsimonia non è veramente un gold standard, ma solo una considerazione.
Voglio aggiungere alcuni commenti che derivano dalla mia esperienza lavorativa quotidiana.
La generalizzazione dell'argomentazione della precisione predittiva è, ovviamente, forte, ma è al centro dell'attenzione accademica. In generale, quando si produce un modello statistico, le economie non sono tali che la performance predittiva è una considerazione completamente dominante. Molto spesso ci sono grandi vincoli esterni sull'aspetto di un modello utile per una data applicazione:
- Il modello deve essere implementabile all'interno di un framework o sistema esistente.
- Il modello deve essere comprensibile da un'entità non tecnica.
- Il modello deve essere efficiente dal punto di vista computazionale.
- Il modello deve essere documentabile .
- Il modello deve superare i vincoli normativi .
Nei domini applicativi reali, molte se non tutte queste considerazioni vengono prima , non dopo , prestazioni predittive - e l'ottimizzazione della forma e dei parametri del modello è vincolata da questi desideri. Ognuno di questi vincoli orienta lo scienziato verso la parsimonia.
Può essere vero che in molti settori questi vincoli vengono gradualmente eliminati. Ma è proprio lo scienziato fortunato che riesce a ignorarli, ma si concentra esclusivamente sulla minimizzazione dell'errore di generalizzazione.
Questo può essere molto frustrante per la prima volta scienziato, appena uscito dalla scuola (sicuramente è stato per me, e continua ad esserlo quando sento che i vincoli posti sul mio lavoro non sono giustificati). Ma alla fine, lavorare sodo per produrre un prodotto inaccettabile è uno spreco, e questo è peggio del dolore per il tuo orgoglio scientifico.