Supponiamo che io abbia una serie di osservazioni univariate indipendenti e identicamente distribuite due ipotesi su come stato generato:x
x : è tratto da una singola distribuzione gaussiana con media e varianza sconosciute.
x : è tratto da una miscela di due gaussiani con media sconosciuta, varianza e coefficiente di miscelazione.
Se ho capito bene, questi sono modelli nidificati poiché il modello rappresentato da può essere descritto in termini di se si vincolano i parametri dei due gaussiani per essere identici o si vincola il coefficiente di miscelazione su zero per uno dei due gaussiani. H A
Pertanto, sembra che dovresti essere in grado di utilizzare l'algoritmo EM per stimare i parametri di e quindi utilizzare il teorema di Wilks per determinare se la probabilità dei dati in è significativamente maggiore di quella in . C'è un piccolo balzo di fiducia nell'ipotesi che l'algoritmo EM converga alla massima probabilità qui, ma è quello che sono disposto a fare.H A H 0
Ho provato questo in una simulazione monte carlo, supponendo che abbia 3 gradi di libertà in più rispetto a (media e varianza per il secondo gaussiano e il parametro di miscelazione). Quando ho simulato i dati da , ho ottenuto una distribuzione del valore P sostanzialmente non uniforme e arricchita per piccoli valori P. (Se EM non stesse convergendo alla massima verosimiglianza, ci si aspetterebbe l'esatto contrario.) Cosa c'è di sbagliato nella mia applicazione del teorema di Wilks che sta creando questo pregiudizio?H 0 H 0