Ho un set di dati contenente dati su temperatura, precipitazioni e rese di soia per un'azienda agricola per 10 anni (2005-2014). Vorrei prevedere i rendimenti per il 2015 sulla base di questi dati.
Si noti che il set di dati ha valori GIORNALIERI per temperatura e precipitazioni, ma solo 1 valore all'anno per la resa, poiché la raccolta delle colture avviene alla fine della stagione di crescita delle colture.
Voglio costruire una regressione o qualche altro modello basato sull'apprendimento automatico per prevedere i rendimenti del 2015, basato su una regressione / qualche altro modello derivato studiando la relazione tra rese, temperatura e precipitazioni negli anni precedenti.
Ho familiarità con l'esecuzione dell'apprendimento automatico utilizzando scikit-learn. Tuttavia, non sono sicuro di come rappresentare questo problema. La parte difficile qui è che la temperatura e le precipitazioni sono quotidiane ma la resa è solo 1 valore all'anno.
Come posso affrontarlo?