L'ANOVA a effetti fissi (o il suo equivalente di regressione lineare) fornisce una potente famiglia di metodi per analizzare questi dati. Per illustrare, ecco un set di dati coerente con i grafici dell'HC medio per sera (un diagramma per colore):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA di count
contro day
e color
produce questa tabella:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
Il model
valore p di 0,0000 mostra che l'adattamento è altamente significativo. Anche il day
valore p di 0,0000 è molto significativo: è possibile rilevare le variazioni giornaliere. Tuttavia, il color
valore p (semestre) di 0,2001 non deve essere considerato significativo: non è possibile rilevare una differenza sistematica tra i tre semestri, anche dopo aver controllato la variazione giornaliera.
Il test HSD di Tukey ("onesta differenza significativa") identifica i seguenti cambiamenti significativi (tra gli altri) nelle medie quotidiane (indipendentemente dal semestre) al livello 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Ciò conferma ciò che l'occhio può vedere nei grafici.
Poiché i grafici saltano un po 'in giro, non c'è modo di rilevare le correlazioni giornaliere (correlazione seriale), che è l'intera analisi delle serie temporali. In altre parole, non preoccuparti delle tecniche delle serie temporali: qui non ci sono dati sufficienti per fornire loro una visione più approfondita.
Ci si dovrebbe sempre chiedere quanto credere ai risultati di qualsiasi analisi statistica. Vari sistemi diagnostici per l'eteroscedasticità (come il test Breusch-Pagan ) non mostrano nulla di spiacevole. I residui non sembrano molto normali - si raggruppano in alcuni gruppi - quindi tutti i valori p devono essere presi con un granello di sale. Tuttavia, sembrano fornire una guida ragionevole e aiutare a quantificare il senso dei dati che possiamo ottenere guardando i grafici.
È possibile eseguire un'analisi parallela sui minimi giornalieri o sui massimi giornalieri. Assicurati di iniziare con un diagramma simile come guida e di controllare l'output statistico.