Morey et al (2015) sostengono che gli intervalli di confidenza sono fuorvianti e ci sono molteplici preconcetti legati alla loro comprensione. Tra gli altri, descrivono l'errore di precisione come segue:
L'errore di precisione
L'ampiezza di un intervallo di confidenza indica la precisione della nostra conoscenza del parametro. Intervalli di confidenza ristretti mostrano conoscenze precise, mentre errori di confidenza ampi mostrano conoscenze imprecise.Non esiste alcuna connessione necessaria tra la precisione di una stima e la dimensione di un intervallo di confidenza. Un modo per vedere questo è immaginare due ricercatori - un ricercatore senior e uno studente di dottorato - stanno analizzando i dati di partecipanti di un esperimento. Come esercizio a beneficio dello studente di dottorato, il ricercatore senior decide di dividere casualmente i partecipanti in due set da modo che ciascuno di essi possa analizzare separatamente metà del set di dati. In una successiva riunione, i due condividono con l'uno la loro Student intervalli di confidenza per la media. L' IC dello studente di dottorato è di e l' IC del ricercatore senior è di .
Il ricercatore senior osserva che i loro risultati sono sostanzialmente coerenti e che potrebbero usare la media equamente ponderata delle loro rispettive due stime dei punti, , come stima complessiva della media reale.
Lo studente di dottorato, tuttavia, sostiene che i loro due mezzi non dovrebbero essere ponderati in modo uniforme: nota che la sua IC è metà della larghezza e sostiene che la sua stima è più precisa e quindi dovrebbe essere ponderata più pesantemente. Il suo consulente osserva che ciò non può essere corretto, poiché la stima della ponderazione irregolare dei due mezzi sarebbe diversa dalla stima dell'analisi del set di dati completo, che deve essere . L'errore dello studente di dottorato è assumere che gli EC indicano direttamente la precisione post-dati.
L'esempio sopra sembra essere fuorviante. Se dividessimo casualmente un campione a metà, in due campioni, ci aspetteremmo che sia la media del campione sia gli errori standard siano vicini. In tal caso non dovrebbe esserci alcuna differenza tra l'utilizzo della media ponderata (ad esempio, ponderata per errori inversi) e l'uso della media aritmetica semplice. Tuttavia, se le stime differiscono e gli errori in uno dei campioni sono notevolmente maggiori, ciò potrebbe suggerire "problemi" con tale campione.
Ovviamente, nell'esempio sopra, le dimensioni del campione sono le stesse, quindi "unire" i dati prendendo la media dei mezzi equivale a prendere la media dell'intero campione. Il problema è che l'intero esempio segue la logica mal definita che il campione viene prima diviso in parti, per poi essere ricollegato per la stima finale.
L'esempio può essere riformulato per portare esattamente alla conclusione opposta:
Il ricercatore e lo studente hanno deciso di dividere il set di dati in due metà e di analizzarli in modo indipendente. Successivamente, hanno confrontato le loro stime e sembrava che il campione significasse che i loro calcoli erano molto diversi, inoltre l'errore standard della stima dello studente era molto maggiore. Lo studente aveva paura che ciò potesse suggerire problemi con la precisione della sua stima, ma il ricercatore ha sottinteso che non vi è alcuna connessione tra intervalli di confidenza e precisione, quindi entrambe le stime sono ugualmente affidabili e possono pubblicarne una qualsiasi, scelta a caso, come stima finale.
Dichiarandolo in modo più formale, gli intervalli di confidenza "standard", come la di Student , si basano su errori
dove è una costante. In tal caso, sono direttamente correlati alla precisione, no ...?
Quindi la mia domanda è:
l'errore di precisione è davvero un errore? Cosa dicono gli intervalli di confidenza sulla precisione?
Morey, R., Hoekstra, R., Rouder, J., Lee, M., & Wagenmakers, E.-J. (2015). L'errore di riporre fiducia negli intervalli di confidenza. Bollettino psicologico e revisione, 1–21. https://learnbayes.org/papers/confidenceIntervalsFallacy/