Questa è una situazione semplice; continuiamo così. La chiave è concentrarsi su ciò che conta:
Ottenere una descrizione utile dei dati.
Valutare deviazioni individuali da quella descrizione.
Valutare il possibile ruolo e influenza del caso nell'interpretazione.
Mantenere l'integrità intellettuale e la trasparenza.
Ci sono ancora molte scelte e molte forme di analisi saranno valide ed efficaci. Illustriamo qui un approccio che può essere raccomandato per la sua aderenza a questi principi chiave.
Per mantenere l'integrità, suddividiamo i dati a metà: le osservazioni dal 1972 al 1990 e quelle dal 1991 al 2009 (19 anni ciascuna). Adatteremo i modelli alla prima metà e vedremo poi come funzionano gli adattamenti nella proiezione della seconda metà. Ciò ha l'ulteriore vantaggio di rilevare cambiamenti significativi che potrebbero essersi verificati durante la seconda metà.
Per ottenere una descrizione utile, dobbiamo (a) trovare un modo per misurare le modifiche e (b) adattarsi al modello più semplice possibile appropriato per tali modifiche, valutarlo e adattarlo iterativamente a quelli più complessi per compensare le deviazioni dai modelli semplici.
(a) Hai molte scelte: puoi guardare i dati grezzi; puoi vedere le loro differenze annuali; puoi fare lo stesso con i logaritmi (per valutare le modifiche relative); puoi valutare anni di vita persi o aspettativa di vita relativa (RLE); o molte altre cose. Dopo qualche riflessione, ho deciso di considerare l'RLE, definito come il rapporto tra l'aspettativa di vita nella Coorte B rispetto a quello della (riferimento) Coorte A. Fortunatamente, come mostrano i grafici, l'aspettativa di vita nella Coorte A sta aumentando regolarmente in una stalla moda nel tempo, in modo che la maggior parte della variazione casuale nella RLE sarà dovuta a cambiamenti nella Coorte B.
(b) Il modello più semplice possibile per iniziare è una tendenza lineare. Vediamo come funziona.
I punti blu scuro in questo diagramma sono i dati conservati per l'adattamento; i punti in oro chiaro sono i dati successivi, non utilizzati per l'adattamento. La linea nera è adatta, con una pendenza di 0,009 / anno. Le linee tratteggiate sono intervalli di previsione per singoli valori futuri.
Nel complesso, la vestibilità sembra buona: l' esame dei residui (vedi sotto) non mostra cambiamenti importanti nelle loro dimensioni nel tempo (durante il periodo di dati 1972-1990). (C'è qualche indicazione che tendevano ad essere più grandi all'inizio, quando le aspettative di vita erano basse. Potremmo gestire questa complicazione sacrificando un po 'di semplicità, ma è improbabile che i benefici per la stima della tendenza siano grandi.) C'è solo il più piccolo suggerimento di correlazione seriale (esibita da alcune serie di positive e serie di residui negativi), ma chiaramente questo non è importante. Non ci sono valori anomali, che sarebbero indicati da punti oltre le bande di predizione.
La sorpresa è che nel 2001 i valori sono crollati all'improvviso nella fascia di previsione inferiore e sono rimasti lì: qualcosa di piuttosto improvviso e di grandi dimensioni è accaduto e persistito.
Ecco i residui, che sono le deviazioni dalla descrizione menzionata in precedenza.
Poiché vogliamo confrontare i residui con 0, le linee verticali vengono disegnate al livello zero come aiuto visivo. Ancora una volta, i punti blu mostrano i dati utilizzati per l'adattamento. Quelli in oro chiaro sono i residui per i dati che si avvicinano al limite di predizione inferiore, post 2000.
Da questa cifra possiamo stimare che l'effetto della variazione 2000-2001 era di circa -0,07 . Ciò riflette un improvviso calo di 0,07 (7%) di una vita intera all'interno della Coorte B. Dopo tale calo, lo schema orizzontale dei residui mostra che la tendenza precedente è continuata, ma al nuovo livello inferiore. Questa parte dell'analisi dovrebbe essere considerata esplorativa : non è stata specificamente pianificata, ma è stata creata a causa di un sorprendente confronto tra i dati forniti (1991-2009) e l'adattamento al resto dei dati.
Un'altra cosa - anche usando solo i primi 19 anni di dati, l'errore standard della pendenza è piccolo: è solo .0009, solo un decimo del valore stimato di .009. La corrispondente statistica t di 10, con 17 gradi di libertà, è estremamente significativa (il valore p è inferiore a ); cioè, possiamo essere certi che la tendenza non è dovuta al caso. Questa è una parte della nostra valutazione del ruolo del caso nell'analisi. Le altre parti sono gli esami dei residui.10−7
Non sembra esserci alcun motivo per adattare un modello più complicato a questi dati, almeno non allo scopo di stimare se nel RLE c'è una tendenza reale nel tempo: ce n'è uno. Potremmo andare oltre e suddividere i dati in valori precedenti al 2001 e valori successivi al 2000 al fine di affinare le nostre stimedelle tendenze, ma non sarebbe del tutto onesto condurre test di ipotesi. I valori di p sarebbero artificialmente bassi, poiché i test di divisione non erano stati pianificati in anticipo. Ma come esercizio esplorativo, tale stima va bene. Scopri tutto ciò che puoi dai tuoi dati! Fai solo attenzione a non illuderti con un overfitting (che è quasi sicuro che accada se usi più di una mezza dozzina di parametri o usi tecniche di adattamento automatizzate) o lo snooping dei dati: stai attento alla differenza tra conferma formale e informale (ma prezioso) esplorazione dei dati.
Riassumiamo:
Selezionando una misura adeguata dell'aspettativa di vita (RLE), distribuendo metà dei dati, adattando un modello semplice e testando quel modello rispetto ai dati rimanenti, abbiamo stabilito con alta sicurezza che : c'era una tendenza costante; è stato vicino al lineare per un lungo periodo di tempo; e c'è stato un improvviso calo persistente di RLE nel 2001.
Il nostro modello è straordinariamente parsimonioso : richiede solo due numeri (una pendenza e un'intercettazione) per descrivere accuratamente i primi dati. Ha bisogno di un terzo (la data della pausa, 2001) per descrivere un'ovvia ma inaspettata partenza da questa descrizione. Non ci sono valori anomali relativi a questa descrizione di tre parametri. Il modello non verrà sostanzialmente migliorato caratterizzando la correlazione seriale (il focus delle tecniche delle serie temporali in generale), tentando di descrivere le piccole deviazioni individuali (residui) mostrate o introducendo adattamenti più complicati (come l'aggiunta di una componente temporale quadratica o modellando le variazioni delle dimensioni dei residui nel tempo).
La tendenza è stata di 0,009 RLE all'anno . Ciò significa che ad ogni anno che passa, l'aspettativa di vita all'interno della Coorte B ha avuto 0,009 (quasi l'1%) di una vita normale piena attesa aggiunta ad esso. Nel corso dello studio (37 anni), ciò equivarrebbe a 37 * 0,009 = 0,34 = un terzo di un miglioramento completo della vita. La battuta d'arresto nel 2001 ha ridotto tale guadagno a circa 0,28 di una vita intera dal 1972 al 2009 (anche se durante quel periodo l'aspettativa di vita complessiva è aumentata del 10%).
Sebbene questo modello possa essere migliorato, probabilmente avrebbe bisogno di più parametri e è improbabile che il miglioramento sia eccezionale (come attesta il comportamento quasi casuale dei residui). Nel complesso, quindi, dovremmo accontentarci di arrivare a una descrizione così compatta, utile e semplice dei dati per così poco lavoro analitico.