Il mio background è principalmente nell'apprendimento automatico e stavo cercando di capire cosa significassero i test sull'ipotesi bayesiana. Sono d'accordo con l'interpretazione bayesiana della probabilità e la conosco nel contesto di modelli grafici probabilistici. Tuttavia, ciò che mi confonde è ciò che la parola "Ipotesi" significa nel contesto dell'inferenza statistica.
Penso che mi sto principalmente confondendo sul vocabolario a cui sono abituato nell'apprendimento automatico rispetto a ciò che viene normalmente utilizzato in statistica e inferenza.
Nel contesto di apprendimento supervisionato , io di solito penso dell'ipotesi come funzione predittiva che mappa esempi per le sue etichette cioè . Tuttavia, mi sembra che il termine ipotesi, nelle letture che sto facendo, non abbia lo stesso significato. Lasciami incollare un estratto delle letture che sto leggendo:
Se leggi attentamente dice anche:
esiste un modello diverso per i dati osservati ...
dove usano il modello di parola. Per me la parola modello mi fa pensare a un insieme di funzioni dove selezioniamo una specifica funzione predittiva. cioè una classe di ipotesi di funzione. Ad esempio, potrebbe essere la classe di ipotesi delle funzioni quadratiche (polinomio di grado 2). Tuttavia, mi sembra che usino il modello di parole e le ipotesi come sinonimi in questo estratto (dove per me sono parole completamente diverse).
Quindi continua menzionando che possiamo mettere i priori all'ipotesi (una cosa completamente ragionevole da fare in un ambiente bayesiano):
inoltre possiamo caratterizzare i dati con un'ipotesi attuale:
e aggiorna le nostre attuali convinzioni dati alcuni dati (e la regola di Baye):
Tuttavia, credo di essere più abituato a mettere una stima bayesiana su un particolare parametro (diciamo ) da una classe di ipotesi piuttosto che all'intera classe di ipotesi. Fondamentalmente poiché sembra che queste "ipotesi" non siano le stesse ipotesi dal contesto di machine learning a cui sono abituato, mi sembra che queste ipotesi siano più simili a un parametro θ specifico che a una classe di ipotesi.
A questo punto ero convinto che "ipotesi" significasse la stessa cosa della funzione predittiva (parametrizzata da un parametro , ad esempio), ma penso di aver sbagliato ...
A peggiorare la mia confusione, in seguito questa stessa lettura è andata avanti per specificare una particolare "ipotesi" per ciascun esempio di allenamento che hanno osservato. Lasciami incollare un estratto di ciò che intendo:
il motivo per cui questo mi confonde è che, se interpreto l'ipotesi come parametro, per me non ha senso specificare un parametro specifico per ciascun valore di esempio che vediamo. A questo punto ho concluso che non sapevo davvero cosa intendessero per ipotesi, quindi ho pubblicato questa domanda.
Tuttavia, non mi sono arreso completamente, ho studiato significato di ipotesi nelle statistiche dei frequentisti e trovato il seguente video dell'Accademia di Khan . Quel video in realtà ha molto senso per me (forse sei un frequentatore! :) . Tuttavia, sembra che ottengano un sacco di dati (come alcuni "set di campioni") e in base alle proprietà del set di campioni, decidono se accettare o rifiutare l'ipotesi nulla sui dati. Tuttavia, nel contesto bayesiano che sto leggendo, mi sembra che per ogni vettore di dati [punto] che si osserva, essi "lo etichettano" con un'ipotesi con il "test del rapporto di verosimiglianza":
Il modo in cui stanno assegnando l'ipotesi a ciascun campione di dati, sembra anche un'impostazione di apprendimento supervisionata se stiamo attaccando un'etichetta a ciascun set di formazione. Tuttavia, non credo sia quello che stanno facendo in questo contesto.Cosa stanno facendo? Cosa significa assegnare un'ipotesi a ciascun campione di dati? Qual è il significato di un'ipotesi? Cosa significa la parola modello?
Fondamentalmente, dopo questa lunga spiegazione della mia confusione, qualcuno sa cosa significa test di ipotesi bayesiana in questo contesto?
Se hai bisogno di chiarimenti o altro per migliorare la mia domanda o affinché la domanda abbia un senso, sono più che felice di aiutarti :)
Nella mia ricerca di una risposta ho trovato alcune cose utili relative al test delle ipotesi statistiche:
Questo affronta una buona introduzione all'argomento se vieni da un background CS (come me):
Qual è una buona introduzione al test delle ipotesi statistiche per gli informatici?
Ad un certo punto ho chiesto dei "parametri predefiniti" (che avrei dovuto definire cosa intendevo dire. Pensavo fosse un termine standard ma non lo è, quindi qui lo affronterò) e penso che ciò che intendevo veramente è come fare specifichi i parametri per ogni ipotesi che hai. Ad esempio, come decidi qual è la tua ipotesi nulla e i suoi parametri. C'è una domanda a riguardo: