Ecco un po 'di contesto. Sono interessato a determinare in che modo due variabili ambientali (temperatura, livelli di nutrienti) influiscono sul valore medio di una variabile di risposta in un periodo di 11 anni. All'interno di ogni anno sono disponibili dati provenienti da oltre 100.000 località.
L'obiettivo è determinare se, durante il periodo di 11 anni, il valore medio delle variabili di risposta ha risposto ai cambiamenti delle variabili ambientali (ad es. Temperatura più calda + più nutrienti = risposta maggiore).
Sfortunatamente, poiché la risposta è il valore medio (senza guardare la media, solo una variazione inter-annuale regolare sommergerà il segnale), la regressione sarà di 11 punti dati (1 valore medio all'anno), con 2 variabili esplicative. Per me anche una regressione lineare positiva sarà difficile da considerare come significativa dato che il set di dati è così piccolo (non soddisfa nemmeno i 40 punti / variabili nominali a meno che la relazione non sia molto forte).
Ho ragione a fare questo presupposto? Qualcuno può offrire altri pensieri / prospettive che potrei mancare?
PS: alcuni avvertimenti: non c'è modo di ottenere più dati senza aspettare altri anni. Quindi i dati disponibili sono ciò con cui dobbiamo davvero lavorare.