In questo caso particolare mi riferisco al giorno in cui un lago si congela. Questa data di "congelamento" si verifica solo una volta all'anno, ma a volte non si verifica affatto (se l'inverno è caldo). Quindi un anno il lago potrebbe congelare il giorno 20 (20 gennaio) e un altro anno potrebbe non congelare affatto.
L'obiettivo è quello di capire i driver della data di arrivo.
I predittori sarebbero cose come la temperatura dell'aria autunno / inverno ogni anno. L'anno potrebbe essere un fattore predittivo per la tendenza lineare a lungo termine.
1) L'intero "giorno dell'anno" è una variabile di risposta ragionevole (se no, che cos'è?)?
2) Come si dovrebbero gestire gli anni in cui il lago non si è mai congelato?
Modificare:
Non so quale sia l'etichetta qui, ma ho pensato di pubblicare il risultato dei suggerimenti che ho ricevuto. Ecco il documento, accesso aperto . Ho ricevuto un buon riscontro sull'approccio utilizzato, grazie a @pedrofigueira e @cboettig. Certo, gli errori sono miei.