Io e il mio collega stiamo montando una serie di modelli di effetti misti lineari e non lineari in R. Ci viene chiesto di eseguire una convalida incrociata sui modelli adattati in modo da poter verificare che gli effetti osservati siano relativamente generalizzabili. Questo è normalmente un compito banale, ma nel nostro caso, dobbiamo dividere tutti i dati in una parte di addestramento e una parte di test (ai fini del CV) che non condividono livelli comuni. Per esempio,
I dati di addestramento possono essere basati sui gruppi 1,2,3,4; Il modello montato viene quindi validato in modo incrociato sul gruppo 5.
Quindi questo crea un problema poiché gli effetti casuali basati su gruppo stimati sui dati di allenamento non si applicano ai dati di test. Pertanto, non possiamo CV il modello.
C'è una soluzione relativamente semplice a questo? O qualcuno ha ancora scritto un pacchetto per affrontare questo problema? Qualsiasi suggerimento è il benvenuto!
Grazie!