Test di alcuni contrasti: questo è chiaramente un problema difficile o no?


12

Ho pubblicato questo su mathoverflow e nessuno ha risposto:

Il metodo di Scheffé per identificare contrasti statisticamente significativi è ampiamente noto. Un contrasto tra le , of è una combinazione lineare in cui , e un multiplo scalare di un contrasto è essenzialmente lo stesso contrasto, quindi si potrebbe dire che l'insieme di contrasti è uno spazio proiettivo. Il metodo di Scheffé verifica un'ipotesi nulla secondo cui tutti i contrasti tra queste popolazioni sono e, dato un livello di significatività , rifiuta l'ipotesi nulla con probabilità i = 1 , , r r r i = 1 c i μ i r i = 1 c i = 0μii=1,,rri=1rciμii=1rci=00 α αr0ααdato che l'ipotesi nulla è vera. E se l'ipotesi nulla viene respinta, Scheffé sottolinea che il suo test ci dice che i contrasti differiscono in modo significativo da (non sono sicuro che l'articolo di Wikipedia che ho collegato sottolinea).0

Vorrei sapere se si può fare qualcosa di simile in un diverso tipo di situazione. Considera un modello di regressione lineare semplice , dove , .ε ii . io . d . N ( 0 , σ 2 ) i = 1 , , nYi=α+βxi+εiεii.i.d.N(0,σ2)i=1,,n

L'ipotesi nulla che voglio considerare riguarda un diverso tipo di contrasto. Dice che non esiste un sottoinsieme tale che per ed per , dove . Se il sottoinsieme è specificato in anticipo, quindi un normale a due campioni -test lo fa, ma vogliamo qualcosa che considera tutti i sottoinsiemi e tiene giù la probabilità di rifiutare una vera e propria ipotesi nulla.E ( Y i ) = α 1 + β x i i A E ( Y i ) = α 2 + β x i i A α 1α 2 A tA{1,,n}E(Yi)=α1+βxiiAE(Yi)=α2+βxiiAα1α2At

Si potrebbe capire se l'efficienza non fosse un problema: trovare un test che attraversasse tutte le possibilità . Anche allora è problematico; due contrasti non sarebbero indipendenti. Ho chiesto a un esperto di rilevamenti anomali su questo e ha appena detto che è un incubo combinatorio. Poi ho chiesto se si potesse dimostrare che non esiste un modo efficace per farlo, forse riducendo ad esso un problema NP-difficile. Ha appena detto che sta lontano dai problemi NP-difficili.2n11

Quindi: si può provare che questo problema è "difficile" o che non lo è?


(+1) Copia di un commento per chiarimenti dalla versione MO : Solo un piccolo punto di chiarimento: mentre lo leggo, qualifica secondo la tua ipotesi nulla, ma ( 1 , 2 , 2 ) e ( 1 , 1 , 1 ) non lo fanno (indipendentemente da β ). È quello che intendevi? (Non sembra corrispondere ad alcune delle altre allusioni fatte nella domanda.)(α1,α2,α3)=(1,2,3)(1,2,2)(1,1,1)β
cardinale il

Come affermato sopra, l'ipotesi nulla sarebbe che abbiamo bisogno solo di una , e l'ipotesi alternativa è che ne abbiamo bisogno di due. Non so perché tu ne abbia un terzo. Si potrebbe anche considerare l'ipotesi nulla di una sola α rispetto all'ipotesi alternativa di diversi, e forse è quello che dovrei fare invece. αα
Michael Hardy,

Grazie. Forse sono stato scartato dall'affermazione originale del modello come , in cui ho considerato α un potenziale errore di battitura per α i (poiché successivamente è stato permesso di variare). Yi=α+βxi+εiααi
cardinale il

Bene, certamente se tale dipendesse da i sarebbe un modello troppo parametrizzato, e per nulla simile a quello che normalmente si chiama un "modello di regressione lineare semplice". αi
Michael Hardy,

Risposte:


1

Ho notato che nessuno ha risposto a questa domanda finora ...

Fondamentalmente, la domanda è questa: esiste un vettore 0-1 tale che y i = α + β x i + γ z i + ϵ i dia una (significativamente) misura migliore di y i = α + β x i + ϵ io . "Significativamente migliore" può essere catturato in termini di somme di quadrati come disuguaglianza. La domanda diventa quindi se esiste una soluzione 0-1 alla disuguaglianza f ( z ) t .Z

yi=α+βxi+γzi+ϵi
yi=α+βxi+ϵi.
f(z)t.
Questa è una variante del problema di partizionamento impostato, noto per essere NP-difficile.

Il problema di partizionamento impostato può effettivamente essere ridotto a questo problema? In tal caso, ciò proverebbe che questo è un problema difficile.
Michael Hardy,

Questo problema è difficile almeno quanto il classico set di partizionamento (SPP). SPP prende una combinazione lineare di pesi e cerca di moltiplicarli per +/- 1 per ottenere un'espressione che somma a 0. Qui si desidera soddisfare una disuguaglianza. Se ciò fosse risolvibile in tempo polinomiale per input arbitrari, un argomento di bisection mostra che si potrebbe anche risolvere SPP in tempo polinomiale. Non è esattamente una riduzione, ma è vicina.
user3697176,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.