(Nota che nella parte che hai citato, l'affermazione era condizionale; la frase stessa non ha assunto la sopravvivenza esponenziale, ha spiegato una conseguenza di ciò. Tuttavia, l'assunzione di sopravvivenza esponenziale è comune, quindi vale la pena affrontare la questione del "perché esponenziale "e" why not normal "- dato che il primo è già abbastanza ben coperto, mi concentrerò maggiormente sulla seconda cosa)
I tempi di sopravvivenza normalmente distribuiti non hanno senso perché hanno una probabilità diversa da zero che il tempo di sopravvivenza sia negativo.
Se poi limiti la tua considerazione alle normali distribuzioni che non hanno quasi alcuna possibilità di essere vicino allo zero, non puoi modellare i dati di sopravvivenza che hanno una ragionevole probabilità di un breve tempo di sopravvivenza:
Forse una volta ogni tanto i tempi di sopravvivenza che non hanno quasi nessuna possibilità di brevi tempi di sopravvivenza sarebbero ragionevoli, ma hai bisogno di distribuzioni che abbiano un senso nella pratica - di solito osservi brevi e lunghi tempi di sopravvivenza (e qualsiasi cosa nel mezzo), con in genere una inclinazione distribuzione dei tempi di sopravvivenza). Una distribuzione normale non modificata sarà raramente utile nella pratica.
[Una normale troncata potrebbe essere più spesso un'approssimazione approssimativa ragionevole di una normale, ma altre distribuzioni spesso faranno meglio.]
Il rischio costante dell'esponenziale è talvolta un'approssimazione ragionevole per i tempi di sopravvivenza. Ad esempio, se "eventi casuali" come un incidente contribuiscono in modo determinante al tasso di mortalità, la sopravvivenza esponenziale funzionerà abbastanza bene. (Tra le popolazioni animali, ad esempio, a volte sia la predazione che la malattia possono agire almeno all'incirca come un processo casuale, lasciando qualcosa come un esponenziale come una prima approssimazione ragionevole ai tempi di sopravvivenza.)
Un'ulteriore domanda relativa al troncato normale: se normale non è appropriato perché non normale al quadrato (chi sq con df 1)?
In effetti potrebbe essere un po 'meglio ... ma nota che corrisponderebbe a un rischio infinito a 0, quindi potrebbe essere utile solo occasionalmente. Sebbene sia in grado di modellare casi con una percentuale molto elevata di tempi molto brevi, ha il problema opposto di essere in grado di modellare casi con una sopravvivenza generalmente più breve della media (il 25% dei tempi di sopravvivenza è inferiore al 10,15% del tempo medio di sopravvivenza e metà dei tempi di sopravvivenza è inferiore al 45,5% della media; ovvero la sopravvivenza mediana è inferiore alla metà della media.)
Diamo un'occhiata a una scala χ21 (ovvero una gamma con parametro di forma 12):
[Forse se ne sommi due χ21 variate ... o forse se hai considerato non centrale χ2otterresti alcune possibilità adatte. Al di fuori dell'esponenziale, le scelte comuni delle distribuzioni parametriche per i tempi di sopravvivenza includono Weibull, lognormale, gamma, log-logistico tra molti altri ... nota che il Weibull e la gamma includono l'esponenziale come caso speciale]