Ho pubblicato questo su mathoverflow e nessuno ha risposto:
Il metodo di Scheffé per identificare contrasti statisticamente significativi è ampiamente noto. Un contrasto tra le , of è una combinazione lineare in cui , e un multiplo scalare di un contrasto è essenzialmente lo stesso contrasto, quindi si potrebbe dire che l'insieme di contrasti è uno spazio proiettivo. Il metodo di Scheffé verifica un'ipotesi nulla secondo cui tutti i contrasti tra queste popolazioni sono e, dato un livello di significatività , rifiuta l'ipotesi nulla con probabilità i = 1 , … , r r ∑ r i = 1 c i μ i ∑ r i = 1 c i = 00 α αdato che l'ipotesi nulla è vera. E se l'ipotesi nulla viene respinta, Scheffé sottolinea che il suo test ci dice che i contrasti differiscono in modo significativo da (non sono sicuro che l'articolo di Wikipedia che ho collegato sottolinea).
Vorrei sapere se si può fare qualcosa di simile in un diverso tipo di situazione. Considera un modello di regressione lineare semplice , dove , .ε i ∼ i . io . d . N ( 0 , σ 2 ) i = 1 , … , n
L'ipotesi nulla che voglio considerare riguarda un diverso tipo di contrasto. Dice che non esiste un sottoinsieme tale che per ed per , dove . Se il sottoinsieme è specificato in anticipo, quindi un normale a due campioni -test lo fa, ma vogliamo qualcosa che considera tutti i sottoinsiemi e tiene giù la probabilità di rifiutare una vera e propria ipotesi nulla.E ( Y i ) = α 1 + β x i i ∈ A E ( Y i ) = α 2 + β x i i ∉ A α 1 ≠ α 2 A t
Si potrebbe capire se l'efficienza non fosse un problema: trovare un test che attraversasse tutte le possibilità . Anche allora è problematico; due contrasti non sarebbero indipendenti. Ho chiesto a un esperto di rilevamenti anomali su questo e ha appena detto che è un incubo combinatorio. Poi ho chiesto se si potesse dimostrare che non esiste un modo efficace per farlo, forse riducendo ad esso un problema NP-difficile. Ha appena detto che sta lontano dai problemi NP-difficili.
Quindi: si può provare che questo problema è "difficile" o che non lo è?