Nella mia ricerca ho riscontrato il seguente problema generale: ho due distribuzioni e sullo stesso dominio e un gran numero (ma finito) di campioni da tali distribuzioni. I campioni sono distribuiti in modo indipendente e identico da una di queste due distribuzioni (anche se le distribuzioni possono essere correlate: ad esempio, può essere una miscela di e qualche altra distribuzione.) L'ipotesi nulla è che i campioni provengano da , ipotesi alternativa è che campioni provengono da .
Sto cercando di caratterizzare il tipo I e tipo II gli errori in fase di test del campione, conoscendo le distribuzioni e . In particolare, mi interessa in che delimita un errore dato l'altro, oltre alla conoscenza di e .
Ho fatto una domanda su math.SE in merito alla relazione della distanza di variazione totale tra e e test di ipotesi e ho ricevuto una risposta che ho accettato. Questa risposta ha senso, ma non sono ancora stato in grado di avvolgere la mia mente attorno al significato più profondo dietro la relazione della distanza della variazione totale e il test delle ipotesi in relazione al mio problema. Quindi, ho deciso di passare a questo forum.
La mia prima domanda è: la variazione totale è legata alla somma delle probabilità di errori di tipo I e di tipo II indipendentemente dal metodo di verifica delle ipotesi che si utilizza? In sostanza, fintanto che esiste una probabilità diversa da zero che il campione avrebbe potuto essere generato da una delle distribuzioni, la probabilità di almeno uno degli errori deve essere diversa da zero. Fondamentalmente, non puoi sfuggire alla possibilità che il tuo tester di ipotesi commetta un errore, indipendentemente dalla quantità di elaborazione del segnale che fai. E la variazione totale limita quella possibilità esatta. La mia comprensione è corretta?
Esiste anche un'altra relazione tra gli errori di tipo I e II e le distribuzioni di probabilità sottostanti e : la divergenza di KL . Quindi, la mia seconda domanda è: la divergenza di KL è applicabile solo a uno specifico metodo di test di ipotesi (sembra che si verifichi molto attorno al metodo del rapporto di verosimiglianza) o si può applicare generalmente in tutti i metodi di test di ipotesi? Se è applicabile a tutti i metodi di verifica delle ipotesi, allora perché sembra essere così molto diverso dal limite della variazione totale? Si comporta diversamente?Q
E la mia domanda di fondo è: c'è una serie prescritta di circostanze in cui dovrei usare uno dei due, o è semplicemente una questione di convenienza? Quando il risultato dovrebbe essere derivato usando una sospensione associata usando l'altra?
Mi scuso se queste domande sono banali. Sono uno scienziato informatico (quindi questo mi sembra un problema di abbinamento di schemi fantasiosi :).) Conosco abbastanza bene la teoria dell'informazione e ho anche una laurea in teoria delle probabilità. Tuttavia, sto appena iniziando a imparare tutte queste prove di ipotesi. Se necessario, farò del mio meglio per chiarire le mie domande.