Test di ipotesi rispetto alla stima dei parametri
Tipicamente, le ipotesi sono inquadrate in modo binario. Metterò da parte le ipotesi direzionali, poiché non cambiano molto il problema. È comune, almeno in psicologia, parlare di ipotesi come: la differenza tra i mezzi di gruppo è o non è zero; la correlazione è o non è zero; il coefficiente di regressione è o non è zero; il quadrato r è o non è zero. In tutti questi casi, esiste un'ipotesi nulla di nessun effetto e un'ipotesi alternativa di un effetto.
Questo pensiero binario non è generalmente ciò che ci interessa di più. Una volta che pensi alla tua domanda di ricerca, ti accorgerai quasi sempre di essere effettivamente interessato a stimare i parametri. Sei interessato alla differenza effettiva tra medie di gruppo, o la dimensione della correlazione, o la dimensione del coefficiente di regressione o la quantità di varianza spiegata.
Naturalmente, quando otteniamo un campione di dati, la stima del campione di un parametro non è la stessa del parametro di popolazione. Quindi abbiamo bisogno di un modo per quantificare la nostra incertezza su quale potrebbe essere il valore del parametro. Dal punto di vista del frequentista, gli intervalli di confidenza forniscono un mezzo per fare, anche se i puristi bayesiani potrebbero sostenere che non consentono rigorosamente l'inferenza che potresti voler fare. Dal punto di vista bayesiano, intervalli credibili sulle densità posteriori forniscono un mezzo più diretto per quantificare la tua incertezza sul valore di un parametro di popolazione.
Parametri / dimensioni dell'effetto
R2
C'è un'enorme letteratura in psicologia (e altri campi) che critica l'attenzione sui valori di p, i test di significatività dell'ipotesi nulla e così via (vedi questa ricerca di Google Scholar ). Questa letteratura raccomanda spesso di riportare le dimensioni degli effetti con intervalli di confidenza come una risoluzione (ad esempio, Task Force APA di Wilkinson, 1999).
Passaggi per allontanarsi dal test delle ipotesi binarie
Se stai pensando di adottare questo pensiero, penso che ci siano approcci progressivamente più sofisticati che puoi adottare:
- Approccio 1a. Riporta la stima puntuale del tuo effetto campione (ad esempio, differenze medie di gruppo) sia in termini grezzi che standardizzati. Quando riferisci i tuoi risultati, discuti su cosa significherebbe tale grandezza per la teoria e la pratica.
- Approccio 1b. Aggiungi a 1a, almeno a un livello molto elementare, un certo senso dell'incertezza attorno alla stima dei tuoi parametri in base alla dimensione del campione.
- Approccio 2. Riporta anche gli intervalli di confidenza sulle dimensioni degli effetti e incorpora questa incertezza nel tuo pensiero sui valori plausibili del parametro di interesse.
- Approccio 3. Riportare intervalli credibili bayesiani ed esaminare le implicazioni di varie ipotesi su quell'intervallo credibile, come la scelta del precedente, il processo di generazione dei dati implicito dal modello e così via.
Tra i molti riferimenti possibili, vedrai Andrew Gelman parlare molto di questi problemi sul suo blog e nelle sue ricerche.
Riferimenti
- Nickerson, RS (2000). Test di significatività dell'ipotesi nulla: una revisione di una vecchia e continua controversia. Metodi psicologici, 5 (2), 241.
- Wilkinson, L. (1999). Metodi statistici nelle riviste di psicologia: linee guida e spiegazioni. Psicologo americano, 54 (8), 594. PDF