Una cosa da tenere a mente con la curva di sopravvivenza di Kaplan-Meier è che è sostanzialmente descrittiva e non inferenziale . È solo una funzione dei dati, con un modello incredibilmente flessibile che sta dietro. Questo è un punto di forza perché ciò significa che praticamente non ci sono ipotesi che potrebbero essere infrante, ma un punto debole perché è difficile generalizzarlo e che si adatta sia al "rumore" che al "segnale". Se vuoi fare una deduzione, allora devi sostanzialmente introdurre qualcosa di sconosciuto che desideri conoscere.
Ora un modo per confrontare i tempi mediani di sopravvivenza è fare i seguenti presupposti:
- Ho una stima del tempo medio di sopravvivenza per ciascuna delle i membri, in curva Kaplan-Meier.tioio
- Mi aspetto che il vero tempo di sopravvivenza mediana, sia uguale a questa stima. E ( T i | t i ) = t iTioE( Tio| tio) = tio
- Sono sicuro al 100% che il vero tempo mediano di sopravvivenza è positivo. Pr ( Tio> 0 ) = 1
Ora il modo "più conservatore" di usare questi presupposti è il principio della massima entropia, in modo da ottenere:
p ( Tio| tio) = Ke x p ( - λ Tio)
Dove e λ sono scelti in modo tale che il PDF sia normalizzato e il valore atteso sia t i . Ora abbiamo:Kλtio
= K [ - e x p ( - λ T i )
1 = ∫∞0p ( Tio| tio) dTio= K∫∞0e x p ( - λ Tio) dTio
e ora abbiamo
E ( T i ) = 1= K[ - e x p ( - λ Tio)λ]Tio= ∞Tio= 0= Kλ⟹K= λ
E( Tio) = 1λ⟹λ = t- 1io
E così hai una serie di distribuzioni di probabilità per ogni stato.
p ( Tio| tio) = 1tioe x p ( - Tiotio)( i = 1 , … , N)
Che danno una distribuzione di probabilità congiunta di:
p ( T1, T2, ... , TN| t1, t2, ... , tN) = ∏i = 1N1tioe x p ( - Tiotio)
Ora sembra che tu voglia testare l'ipotesi , dove ¯ t = 1H0: T1= T2= ⋯ = TN= t¯è il tempo medio di sopravvivenza mediano. L'ipotesi alternativa severa da verificare è l'ipotesi "ogni stato è un fiocco di neve unico e bellissimo"HA:T1=t1,...,TN=tNperché questa è l'alternativa più probabile e rappresenta quindi l'informazione persa nel passaggio all'ipotesi più semplice (un test "minimax"). La misura dell'evidenza rispetto all'ipotesi più semplice è data dal rapporto di probabilità:t¯= 1NΣNi = 1tioHUN: T1= t1, ... , TN= tN
O ( HUN| H0) = p ( T1= t1, T2= t2, ... , TN= tN| t1, t2, ... , tN)p ( T1= t¯, T2= t¯, ... , TN= t¯| t1, t2, ... , tN)
= [ ∏Ni = 11tio] exp ( - ∑Ni = 1tiotio)[ ∏Ni = 11tio] exp ( - ∑Ni = 1t¯tio)= e x p ( N[ t¯th a r m- 1 ] )
Dove
th a r m= [ 1NΣi = 1Nt- 1io]- 1≤ t¯
è la media armonica. Si noti che le probabilità favoriranno sempre l'adattamento perfetto, ma non di molto se i tempi di sopravvivenza mediana sono ragionevolmente vicini. Inoltre, questo ti dà un modo diretto per affermare le prove di questo particolare test di ipotesi:
O ( HUN| H0) : 1
Combina questo con una regola di decisione, una funzione di perdita, una funzione di utilità, ecc. Che dice quanto sia vantaggioso accettare l'ipotesi più semplice e hai le tue conclusioni!
H0
HS, i: Tio= tio, Tj= T= t¯( i )= 1N- 1Σj ≠ itj
io
- HUNHS, i
- H0HS, i
- HS, kKio
Ora una cosa che è stata sottovalutata qui sono le correlazioni tra stati: questa struttura presuppone che conoscere il tasso di sopravvivenza mediano in uno stato non dica nulla sul tasso di sopravvivenza mediano in un altro stato. Sebbene ciò possa sembrare "negativo", non è difficile migliorarlo e i calcoli sopra riportati sono buoni risultati iniziali che sono facili da calcolare.
L'aggiunta di connessioni tra stati cambierà i modelli di probabilità e vedrai effettivamente un "raggruppamento" dei tempi di sopravvivenza mediani. Un modo per incorporare correlazioni nell'analisi è di separare i tempi di sopravvivenza reali in due componenti, una "parte comune" o "tendenza" e una "parte individuale":
Tio= T+ Uio
Uioσ