Qual è la distinzione tra un "test statistico di ipotesi nulla" e qualsiasi altro test?


9

Un recente argomento di discussione caldo riguarda una rivista che vieta l'uso di "procedure di test statistici di ipotesi nulla (NHSTP)" dagli articoli presentati alla rivista. Vedo questo termine usato da alcuni scrittori, ma non capisco quale distinzione stiano cercando di fare. Un NHSTP è qualcosa di diverso da un "test di ipotesi" o un "test di significatività"?


1
Un acronimo che viene usato un po 'più spesso è NHST (senza P alla fine). Entrambi gli acronimi sembrano essere termini peggiorativi utilizzati dagli scrittori che lo odiano (nel contesto di tali polemiche). Puoi dare un'occhiata alla ricerca di Google Scholar per NHST + null (1670 risultati, contro solo 145 per NHSTP + null): si tratta di problemi e problemi. Un altro termine peggiorativo correlato è "rituale nullo". Tutto ciò significa cosa pensi che significhi, ma pronunciato con forte disgusto!
amoeba,

2
Esistono test che sono sostanzialmente diversi dal più comune NHST, come i test di equivalenza - sebbene meccanicamente (ma non sorprende) si avvalgano di un quadro strettamente correlato. Tuttavia, immagino che l'editore del diario in questione probabilmente discuterà anche contro quelli.
Glen_b

1
Correlato (ma non un duplicato): Qual è la differenza tra "verifica dell'ipotesi" e "verifica della significatività"? Inoltre, dovrei sottolineare che gli editori di questo diario chiaramente non cercano di fare una distinzione tra questi! Vietano ogni tipo di ipotesi / significato / qualunque test, siano essi Fisher, Neyman-Pearson o ibridi. La distinzione viene fatta solo nel contesto della guerra santa tra Fisher vs Neyman-Pearson (vs. ibrido), che non è ciò di cui si trattava questo divieto del diario.
amoeba,

1
Quindi, @Livid, stai dicendo che "NHST" si riferisce al modo in cui i test statistici sono generalmente utilizzati nella pratica, distinti dai paradigmi Fisher e NP? Immagino che, se a sua volta implica una rotazione della manovella ordinaria e senza pensare, allora concordo sul fatto che è un termine peggiorativo.
Russ Lenth

Risposte:


1

Contesto: L'editoriale in questione è questo uno da base e Psicologia Applicata sociale , un giornale con un fattore di 2.015 impatto di 1.168, vale a dire, non è altamente citabile.

Ri: OP domanda , cioè, un NHSTP è qualcosa di diverso da un "test di ipotesi" o un "test di significatività"? Le dichiarazioni editoriali applicabili sono

1) "...the null hypothesis significance testing procedure (NHSTP)  is invalid..." [Sic, with alpha = 0.05]
2) "...authors will have to remove all vestiges of the NHSTP (p-values, t-values, F-values, statements about ‘‘significant’’ differences or lack thereof, and so on)."
3) "...confidence intervals [Sic, 95%] also are banned from BASP."
4) "...Bayesian procedures are neither required nor banned from BASP." [Sic, depends on which ones, they are either banned or not.]
5) "Are any inferential statistical procedures required?...No..."

p<.05

Risposta a OP: questi redattori sostengono probabilmente che un test di significatività è spesso un test improprio di ipotesi. Ad esempio, affermano che "... proposte bayesiane che almeno eludono in qualche modo l' assunto lappone [Sic, non so nulla a priori ] ... [tale che] potrebbero anche esserci casi in cui vi sono validi motivi per ritenere che il i numeri ci sono davvero ... "Ciò si riferisce in parte all'argomento Fisher contro Neyman e Pearson, come sottolineato sopra da @Livid e per il quale l'editoriale si schiererebbe con Fisher.

Discussione: sono fermamente convinto dell'umiltà intellettuale come principio fondamentale e indispensabile del metodo scientifico. Se io, come ricercatore, non mi è permesso di procedere da una premessa iniziale priva di assunzioni in cui non si crede a tutta la teoria precedente, allora perderò tutta la mia capacità di esaminare i dati con una mente creativa e aperta. La premessa che tutta l'elaborazione numerica deve essere verità assoluta è un'esposizione di cupidità che è sublime. L'unica verità sono i dati, e parafraserei umilmente Boxaffermando che tutti i modelli sono falsi, soprattutto e sicuramente quelli che presumono che qualsiasi verità derivi da qualsiasi cosa che non sia identicamente i dati stessi. Ciò non significa che devo scegliere tra Fisher e Neyman / Pearson, piuttosto che non credo fermamente né premessa presa da sola, ma piuttosto esaminare le cose in modo esaustivo fino a quando le mie ipotesi non saranno supportate e / o respinte all'autoconsistenza dell'ensemble. Solo l'autoconsistenza può essere usata come criterio, poiché nessuna analisi può rivelare una verità assoluta.

p<0.050.050.001 non migliorerà il contenuto di un diario.


"... come inquilino fondamentale e indispensabile del metodo scientifico ..." - Mi aspetto che tu intenda il principio anziché l' inquilino .
Glen_b -Sostituisci Monica il

@Glen_b Je tiens à vous remercier . Avrei dovuto saperlo meglio, ma mi aspetto comunque che sia tutto sbagliato. Ergo , per il resto, qualche pensiero?
Carl,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.