Va bene, quindi piuttosto che andare a derivare l'equazione di Saunder (5), la dirò qui. Le condizioni 1 e 2 implicano la seguente uguaglianza:
djk=P(Dj|Hk,I)
Πj = 1m( ∑k ≠ ihKdj k) = ( ∑k ≠ ihK)m - 1( ∑k ≠ ihKΠj = 1mdj k)
dove
dj k= P( Dj| HK, I)hK= P( HK| io)
Ora possiamo specializzarci nel caso (due set di dati) prendendo e rietichettando . Si noti che questi due set di dati soddisfano ancora le condizioni 1 e 2, quindi il risultato sopra si applica anche a loro. Ora espandendo nel caso otteniamo:D ( 1 ) 1 ≡ D 1 Dm = 2D( 1 )1≡ D1m=2D( 1 )2≡ D2D3... Dmm = 2
( ∑k ≠ ihKd1 k) ( ∑l ≠ ihld2 l) = ( ∑k ≠ ihK) ( ∑l ≠ ihld1 ld2 l)
→ ∑k ≠ iΣl ≠ ihKhld1 kd2 l= ∑k ≠ iΣl ≠ ihKhld1 ld2 l
→ ∑k ≠ iΣl ≠ ihKhld2 l( d1 k- d1 l) = 0( i = 1 , … , n )
Il termine ricorre due volte nella summenzionata doppia somma, una volta quando e , e ancora una volta quando e . Ciò accadrà finché . Il coefficiente di ciascun termine è dato da e . Ora, poiché ci sono di queste equazioni, possiamo effettivamente rimuovere da queste equazioni. Per illustrare, prendi , ora questo significa che abbiamo tutte le condizioni tranne dove e . Ora prendi( d1 a- d1 b)k = al = bk = bl = aa , b ≠ id2 b- d2 aioioi = 1a = 1 , b = 2b = 1 , a = 2i = 3e ora possiamo avere queste due condizioni (si noti che ciò presuppone almeno tre ipotesi). Quindi l'equazione può essere riscritta come:
Σl > khKhl( d2 l- d2 k) ( d1 k- d1 l) = 0
Ora ciascuno dei termini deve essere maggiore di zero, poiché altrimenti abbiamo a che fare con ipotesi e la risposta può essere riformulata in termini di . Quindi questi possono essere rimossi dal set di condizioni sopra:hion1< nn1
Σl > k( d2 l- d2 k) ( d1 k- d1 l) = 0
Quindi, ci sono condizioni che devono essere soddisfatte, e ogni condizione implica una delle due "sotto-condizioni": quella per entrambe o (ma non necessariamente entrambi). Ora abbiamo un insieme di tutte le coppie uniche per . Se dovessimo prendere di queste coppie per una delle , allora avremmo tutti i numeri nel set e . Questo perché la prima coppia ha elementi e ogni coppia aggiuntiva porta almeno un elemento aggiuntivo al set *n ( n - 1 )2dj k= dj lj = 1j = 2( k , l )dj k= dj ln - 1j1 , ... , ndj 1= dj 2= ⋯ = dj , n - 1= dj , n2
Tuttavia, poiché esistono le condizioni , dobbiamo scegliere almeno il numero intero più piccolo maggiore o uguale a per uno dei o . Se il numero di termini scelti è maggiore di . Se o allora dobbiamo scegliere esattamente termini. Ciò implica che . Solo con due ipotesi ( ) è dove ciò non si verifica. Ma dall'ultima equazione nell'articolo di Saunder questa condizione di uguaglianza implica:n ( n - 1 )212× n ( n - 1 )2= n ( n - 1 )4j = 1j = 2n > 4n - 1n = 4n = 3n - 1dj 1= dj 2= ⋯ = dj , n - 1= dj , nn = 2
P( Dj| H¯¯¯¯¯io) = ∑k ≠ idj khKΣk ≠ ihK= dj iΣk ≠ ihKΣk ≠ ihK= dj i= P( Dj| Hio)
Quindi, nel rapporto di verosimiglianza abbiamo:
P( D( 1 )1| Hio)P( D( 1 )1| H¯¯¯¯¯io)= P( D1| Hio)P( D1| H¯¯¯¯¯io)= 1 OPPURE P( D( 1 )2| Hio)P( D( 1 )2| H¯¯¯¯¯io)= P( D2D3... , Dm| Hio)P( D2D3... , Dm| H¯¯¯¯¯io)= 1
Per completare la dimostrazione, nota che se la seconda condizione è valida, il risultato è già dimostrato e solo un rapporto può essere diverso da 1. Se la prima condizione è valida, possiamo ripetere l'analisi sopra riassegnando e . Quindi avremmo non ha contribuito o è l'unico contributore. Avremmo quindi una terza rietichettatura quando non contribuiva, e così via. Pertanto, solo un set di dati può contribuire al rapporto di probabilità quando la condizione 1 e la condizione 2 sono valide e vi sono più di due ipotesi.D( 2 )1≡ D2D( 2 )2≡ D3... , DmD1, D2D2D1D2
* NOTA: una coppia aggiuntiva potrebbe non portare nuovi termini, ma questo sarebbe compensato da una coppia che portava 2 nuovi termini. es. prendi come primo [+2], [+1] e [+0], ma il prossimo termine deve avere per entrambi . Ciò aggiungerà due termini [+2]. Se non abbiamo bisogno di scegliere altro, ma per l '"altro" dobbiamo scegliere le 3 coppie che non sono . Questi sono e quindi vale l'uguaglianza, poiché tutti i numeri sono nell'insieme.dj 1= dj 2dj 1= dj 3dj 2= dj 3dj k= dj lk , l ∉ ( 1 , 2 , 3 )n = 4j( 1 , 2 ) , ( 2 , 3 ) , ( 1 , 3 )( 1 , 4 ) , ( 2 , 4 ) , ( 3 , 4 )( 1 , 2 , 3 , 4 )