Esistono test statistici "esoterici" a bassissima potenza?


11

sfondo

In informatica, matematica e talvolta in altri campi, esempi "esoterici" non possono solo essere divertenti, ma utili per illustrare alcuni concetti, ad esempio:

  • Bogosort e Slowsort sono algoritmi di ordinamento molto inefficienti che possono essere utilizzati per comprendere le proprietà degli algoritmi, in particolare se confrontati con altri algoritmi di ordinamento.

  • I linguaggi di programmazione esoterici dimostrano quanto sia vasto il concetto di linguaggio di programmazione e aiutano ad apprezzare i buoni linguaggi di programmazione.

  • La funzione Weierstraß e la funzione Dirichlet trovano principalmente impiego per illustrare alcune idee sbagliate sul concetto di continuità.

Attualmente sto preparando alcuni insegnamenti sull'uso dei test di ipotesi e penso che avere un test con potenza molto bassa (ma nessun altro difetto) aiuterebbe a illustrare il concetto di potere statistico. (Certo, devo ancora decidere da solo se un dato esempio è didatticamente utile per il mio pubblico o semplicemente confuso.)

Domanda reale

Esistono test statistici con potenza intenzionalmente bassa, in particolare:

  • Il test si inserisce nel quadro generale dei test di ipotesi, vale a dire, funziona con un'ipotesi nulla, ha requisiti e restituisce un  valore p (corretto) .
  • Non è previsto / proposto per un'applicazione seria.
  • Ha una potenza molto bassa (a causa di un difetto di progettazione intenzionale e non a causa di dimensioni ridotte del campione o dell'effetto).

Se puoi fondamentalmente sostenere che un test del genere non può esistere, lo considererei anche una risposta valida alla mia domanda. Se, d'altra parte, esiste una pletora di tali test, sono interessato a quello più didatticamente efficiente, cioè dovrebbe essere facilmente accessibile e avere un effetto sorprendente.

Si noti che non sto chiedendo una selezione generale di errori statistici (raccolta delle ciliegie, ecc.) O simili.

Quello che ho trovato finora

Le ricerche su Internet non hanno restituito nulla per me.

Ogni tentativo di costruire qualcosa di simile è finito in un test (utile) esistente o il formato non è quello di un test normale. Ad esempio, ho pensato a un test per stabilire se una popolazione ha una mediana positiva che restituisce solo se tutti i campioni sono positivi; ma quel test non restituisce un  valore p e quindi non rientra nel consueto framework di test. Se conto solo i segni positivi e negativi come statistica di test (e calcolo i  valori p di conseguenza), finisco con il test dei segni , che è un test ragionevole.


2
Essere esempi più matematici, "esoterici" (che abbondano) tendono ad essere controesempi specifici a incomprensioni popolari; un certo numero di libri di testo contiene tali esempi. Allo stato attuale, la tua domanda è essenzialmente una domanda di tipo "grande elenco" ed è quindi troppo ampia (anche se dovresti notare che diversi utenti hanno concluso che la domanda non è chiara); se puoi chiarire la tua domanda e restringere il suo campo di applicazione, potrebbe adattarsi meglio al sito.
Glen_b -Restate Monica

1
Bassa potenza rispetto a cosa? Lehmann ha fornito un esempio di un test del rapporto di verosimiglianza generalizzato che aveva una potenza inferiore in qualsiasi ipotesi alternativa rispetto al nulla.
Scortchi - Ripristina Monica

2
Qualunque stupido stimatore a cui applichi Rao-Blackwellization potrebbe essere usato come statistica di test. Ad esempio, c'è la prima osservazione nel campione, usata come stimatore della media. Quando Rao-Blackwellized, si ottiene la media del campione. Ho dovuto fare molti esercizi come questo in classe. Comunque, questa statistica potrebbe essere usata al posto della media del campione in qualcosa come un test . Ma no, non riesco a pensare a niente direttamente nella forma che stai cercando, o scriverei una risposta, non un commento. Ma ci deve essere qualcosa che illustri il fallimento di un metodo generale per la costruzione di test. t
user54038,

1
Prenderò il foglio di Lehmann quando sarò al computer. La potenza di un test sotto il valore null è solo la dimensione del test.
Scortchi - Ripristina Monica

3
Un esempio di test usato in una classe in cui ero uno studente (molti anni fa) era "tirare un dado a 20 facce e rifiutare se si lancia un 1" (come parte di una discussione sulle curve di potenza). Questo ovviamente ignora completamente i dati, ma è un test "valido" in quanto non ha un tasso di errore di tipo I superiore al desiderato (che era del 5% nel contesto in cui è stato fornito l'esempio).
Glen_b

Risposte:


7

C'è un corollario poco commentato sul lemma di Neyman – Pearson (prova in Geisser (2006), Modes of Parametric Statistical Inference , Ch 4.4): definisce il livello meno potente- test, , dell'ipotesi nulla densità vs densità dai dati .

Eϕ(X)=α
ϕ(x)={0 when f0(x)<kf1(x)1 when f0(x)>kf1(x)
αϕH0:f0H1:f1x

Da questo risultato è possibile ricavare test "totalmente distorti" uniformemente meno potenti, localmente meno potenti, uniformemente meno potenti simili e meno potenti (intendo quelli con potenza inferiore in qualsiasi alternativa rispetto al valore nullo). Se hai già un dispositivo uniformemente più potente, ecc. test, moltiplica semplicemente la statistica del test per -1 per mantenere il partizionamento dello spazio campione che induce mentre inverti l'ordine delle partizioni.


Forse, come suggerisce @ user54038, "il fallimento di un metodo generale di costruzione di test" potrebbe essere più interessante. Lehmann (1950), "Alcuni principi della teoria del test delle ipotesi statistiche", Ann. Matematica. Statist. , 21 , 1, attribuisce il seguente esempio a Stein:

Sia una variabile casuale in grado di assumere i valori con probabilità come indicato:X0,±1,±2

22110Hypothesis H:α2α212α12ααAlternatives:pC(1p)C1C1α(12α)1C1α(12α)α1c1α
Qui, , , sono costanti , e varia nell'intervallo .αC0<α12α2α<C<αp[0,1]

Si desidera verificare l'ipotesi a livello di significatività . Il test del rapporto di verosimiglianza rifiuta quando , e quindi la sua potenza è contro ogni alternativa. Poiché , questo test è letteralmente peggio che inutile, poiché un test con potenza può essere ottenuto senza osservare , semplicemente usando una tabella di numeri casuali.HαX=±2CC<ααX

Si noti che è il test di probabilità generalizzato che sta prendendo in considerazione, con nel ruolo di un parametro di disturbo da massimizzare. Quindi quando o , o rispettivamente, e il rapporto di probabilità arriva a in entrambi i casi; per qualsiasi altro valore di è il valore più basso di .pX=2X=2p^=1p^=02CαX1C1α


5

(Relativo al commento di @Scortchi)

Supponiamo che e vogliamo testare l'ipotesiXN(μ,1)

H0:μ=0H1:μ0

Per motivi di estetismo, aumentiamo i nostri dati con un "lancio di monete" indipendente cui è noto e non inferiore al livello di significatività (cioè ). Prendi in considerazione le regioni di rifiuto del modulo:ZBernoulli(p)pαp[α,1]

R={(X,Z) | z=1 |x|>Φ1(α2p)}

Per costruzione, questo è un test valido di size .α

P(XR | μ=0)=P(Z=1 , |X|>Φ1(α2p))=P(Z=1)P(|X|>Φ1(α2p))=pαp=α

La potenza di questo test tuttavia non può mai essere superiore a . Ad esempio, supponiamo che i nostri dati osservati siano . È ovvio che l'ipotesi nulla dovrebbe essere respinta, ma poiché la nostra moneta "mostra le code" non riusciamo a respingere il nulla. L'impostazione di porta a un esempio ancora più sciocco in cui la regione di rifiuto non dipende affatto da , ma è comunque una regione di rifiuto valida con dimensione .p(x,z)=(1000000,0)p=αXα

Una domanda simile potrebbe essere posta come compito a casa cambiando l'intersezione in unione nella regione del rifiuto. Questa regione è uniformemente meno potente di quella senza , ma è più ragionevole nel senso che il potere non ha un limite superiore.Z


2
(+1) Strettamente correlato perché avente una statistica accessoria unidimensionale , puoi rinunciare al lancio della moneta lasciando , dove è la funzione di ripartizione di . Z = 1 ( S < F - 1 S ( p ) ) F S ( ) SSZ=1(S<FS1(p))FS()S
Scortchi - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.