Ho esaminato numerose domande su questo sito per quanto riguarda il bootstrap e gli intervalli di confidenza, ma sono ancora confuso. Parte del motivo della mia confusione è probabilmente che non sono abbastanza avanzato nelle mie conoscenze statistiche per capire molte delle risposte. Sono a metà del corso di statistica introduttiva e il mio livello di matematica riguarda solo la metà di Algebra II, quindi qualsiasi cosa oltre quel livello mi confonde. Se una delle persone esperte su questo sito potesse spiegare questo problema al mio livello, sarebbe estremamente utile.
Stavamo imparando in classe come prendere campioni usando il metodo bootstrap e usarli per creare un intervallo di confidenza per alcune statistiche che vorremmo misurare. Ad esempio, supponiamo di prelevare un campione da una grande popolazione e di scoprire che il 40% afferma di votare per il candidato A. Partiamo dal presupposto che questo campione sia un riflesso abbastanza accurato della popolazione originale, nel qual caso possiamo prelevare campioni da per scoprire qualcosa sulla popolazione. Quindi prendiamo dei campioni e scopriamo (usando un livello di confidenza del 95%) che l'intervallo di confidenza risultante varia dal 35% al 45%.
La mia domanda è: cosa significa in realtà questo intervallo di confidenza ?
Continuo a leggere che c'è una differenza tra Intervalli di confidenza (frequentisti) e Intervalli credibili (bayesiani). Se avessi capito bene, un intervallo credibile direbbe che c'è una probabilità del 95% che nella nostra situazione il parametro vero sia all'interno dell'intervallo dato (35% -45%), mentre un intervallo di confidenza direbbe che c'è un 95% che in questo il tipo di situazione (ma non necessariamente nella nostra situazione specifica) il metodo che stiamo usando segnalerebbe accuratamente che il vero parametro rientra nell'intervallo dato.
Supponendo che questa definizione sia corretta, la mia domanda è: qual è il "vero parametro" di cui stiamo parlando quando si utilizzano gli intervalli di confidenza creati con il metodo bootstrap? Ci riferiamo a (a) il vero parametro della popolazione originale o (b) il vero parametro del campione ? Se (a), allora dovremmo dire che il 95% delle volte il metodo bootstrap riporterà accuratamente affermazioni vere sulla popolazione originale. Ma come potremmo saperlo? L'intero metodo bootstrap non si basa sul presuppostoche il campione originale è un riflesso accurato della popolazione da cui è stato prelevato? Se (b) non capisco affatto il significato dell'intervallo di confidenza. Non conosciamo già il vero parametro del campione? È una misura semplice!
Ne ho discusso con la mia insegnante ed è stata molto utile. Ma sono ancora confuso.