Data la dimensione del campione abbastanza grande, un test mostrerà sempre risultati significativi a meno che la dimensione reale dell'effetto sia esattamente zero. Perché?


21

Sono curioso di una richiesta fatta nell'articolo di Wikipedia sulla dimensione dell'effetto . In particolare:

[...] un confronto statistico non nullo mostrerà sempre risultati statisticamente significativi a meno che la dimensione dell'effetto della popolazione non sia esattamente zero

Non sono sicuro di cosa significhi / implichi, per non parlare di un argomento a sostegno. Dopo tutto, immagino che un effetto sia una statistica, cioè un valore calcolato da un campione, con una sua distribuzione. Questo significa che gli effetti non sono mai dovuti solo a variazioni casuali (che è ciò che capisco significa non essere significativo)? Consideriamo quindi solo se l'effetto è abbastanza forte, con un valore assoluto elevato?

Sto prendendo in considerazione l'effetto che conosco di più: il coefficiente di correlazione di Pearson r sembra contraddire questo. Perché ogni r dovrebbe essere statisticamente significativo? Se r è piccolo, la nostra linea di regressione

y=un'X+B=r(SySX)=εX+B

Per ε piccolo, è vicino a 0, un test F conterrà probabilmente un intervallo di confidenza contenente 0 per la pendenza. Non è un controesempio?


10
Suggerimento: la clausola prima della parte citata è essenziale. " Data una dimensione del campione sufficientemente grande , un confronto statistico non nullo mostrerà sempre risultati statisticamente significativi a meno che la dimensione dell'effetto della popolazione non sia esattamente zero ..."
Kodiologist

@Kodiologist: Ma, per il mio esempio, ciò implicherebbe che se la dimensione del campione fosse maggiore, allora anche la stessa r sarebbe più grande, o almeno l'espressione sarebbe maggiore se la dimensione del campione fosse maggiore? Non lo vedo r(Sy/SX)
gary

5
Se ciò non fosse vero, sarebbe un difetto nel metodo statistico. Se , sicuramente alcune dimensioni del campione sono abbastanza grandi da rilevare la differenza. μ>μ0
John Coleman,

Risposte:


26

Come semplice esempio, supponiamo che stia valutando la tua altezza usando un jumbo statico di mumbo.

Hai sempre affermato agli altri che sei 177 cm (circa 5 piedi e 10 pollici).

Se dovessi verificare questa ipotesi (che la tua altezza è pari a 177 cm, ), e potrei ridurre abbastanza l'errore nella mia misurazione, allora potrei dimostrare che in realtà non sei 177 cm. Alla fine, se stimassi la tua altezza con abbastanza cifre decimali, quasi sicuramente ti discosteresti dall'altezza dichiarata di 177.00000000 cm. Forse sei 177,02 cm; Devo solo ridurre il mio errore a meno di 0,02 per scoprire che non sei 177 cm.h=177

Come posso ridurre l'errore nelle statistiche? Ottieni un campione più grande. Se si ottiene un campione abbastanza grande, l'errore diventa così piccolo che è possibile rilevare le deviazioni più minuscole dall'ipotesi nulla.


2
Questa è una spiegazione molto chiara e concisa. Probabilmente è più utile per capire perché questo accade rispetto alle risposte più matematiche. Molto bene.
Nessuno il

1
Spiegato bene, ma penso sia anche importante considerare che ci sono casi in cui il valore dichiarato è veramente esatto. Ad esempio, mettendo da parte cose strane che accadono nella teoria delle stringhe, ecc., Una misura del numero di dimensioni spaziali del nostro universo (che può essere fatto) darà 3, e non importa quanto preciso tu faccia quella misura, lo farai non trovare mai deviazioni statisticamente significative da 3. Ovviamente se continui a testare abbastanza volte otterrai alcune deviazioni semplicemente a causa della varianza, ma questo è un problema diverso.
David Z,

Probabilmente una domanda ingenua, ma se sostengo che sono 177 cm, il concetto di cifre significative non significa che sto solo dicendo che sono tra 176,5 e 177,5? La risposta sembra dare un buon concetto teorico, vero, ma non è basato su una premessa errata? Cosa mi sto perdendo?
JimLohse,

In questo caso l'altezza dichiarata di 177 è analoga all'ipotesi nulla in statistica. Nel tradizionale test di ipotesi per l'uguaglianza, fai una dichiarazione di uguaglianza (ad es. ). Il punto è che non importa quale sia la tua altezza, posso confutare riducendo l'errore a meno che l'ipotesi nulla sia ESATTAMENTE vera. Ho usato l'altezza come esempio facile da capire, ma questo concetto è lo stesso in altre aree (la sostanza x non causa il cancro, questa moneta è giusta, ecc.)μ=177
Underminer

13

Come sottolinea @Kodiologist, si tratta in realtà di ciò che accade per campioni di grandi dimensioni. Per campioni di piccole dimensioni non c'è motivo per cui non si possano avere falsi positivi o falsi negativi.

Penso che lo -test chiarisca il caso asintotico. Supponiamo di avere X 1 , ... , X n iid N ( μ , 1 ) e vogliamo testare H 0 : μ = 0 vs H A : μ 0 . La nostra statistica test è Z n = ˉ X n - 0zX1,...,Xn~iidN(μ,1)H0:μ=0HUN:μ0

Zn=X¯n-01/n=nX¯n.

quindiZn=X¯n~N(μ,1n). Siamo interessati aP(|Zn|α). P(|Zn|α)=P(Zn-α)+P(Znα)=1+Φ(-α-μZn=nX¯n~N(μn,1)P(|Zn|α)

P(|Zn|α)=P(Zn-α)+P(Znα)
SiaYN(0,1) lanostra variabile di riferimento. SottoH0μ=0,quindi abbiamoP(|Zn|α)=1-P(-αYα),quindi possiamo scegliereαper controllare il nostro tasso di errore di tipo I come desiderato. Ma sottoHAμ
=1+Φ(-α-μn)-Φ(α-μn).
Y~N(0,1)H0 μ=0P(|Zn|α)=1-P(-αYα)αHUN quindi P(|Zn|α)1+Φ(±)-Φ(±)=1 quindi con probabilità 1 rifiuteremoH0seμ0(il±è in caso diμ<0, ma in entrambi i casi gli infiniti hanno lo stesso segno).μn0
P(|Zn|α)1+Φ(±)-Φ(±)=1
H0μ0±μ<0

Il punto è che se esattamente uguale a 0, la nostra statistica test ha la distribuzione di riferimento e rifiuteremo il 5% (o qualunque cosa scegliamo) del tempo. Ma se μ non è esattamente 0 , allora la probabilità che ci rifiutiamo teste a 1 come n aumenta. L'idea qui è la coerenza di un test, che è che sotto H A la potenza (probabilità di rigetto) va a 1 come n .μ 0μ01nHUN1n

H0:ρ=ρ0HUN:ρρ01


1
μ<0Zn-

1
μ=0X¯p0n

1
@DeltaIV, giusto, se il tasso di convergenza fosse diverso, sarebbe necessario un ridimensionamento diverso per ottenere una distribuzione nulla non generata. Ma per il presente esempio, root-n è il tasso giusto.
Christoph Hanck,

1
nX¯0

7

Probabilmente ciò che hanno detto è sbagliato, se non altro per il loro uso di "questo accade sempre ".

Non so se questo è il nocciolo della confusione che stai avendo, ma lo posterò perché penso che molti lo facciano e ne rimarrò confuso:

Xnn>n0X

limnPr(X)=1

Ciò che stanno letteralmente dicendo si traduce in quanto segue:

nn0

Quello che stavano cercando di dire, tuttavia, è il seguente:

Per qualsiasi livello di significatività, all'aumentare della dimensione del campione, la probabilità che un test non nullo produca un risultato significativo si avvicina a 1 se la dimensione dell'effetto reale non è esattamente zero.

Ci sono differenze cruciali qui:

  • Non c'è garanzia È più probabile che tu ottenga un risultato significativo con un campione più grande. Ora, potrebbero schivare parte della colpa qui, perché finora è solo un problema di terminologia. In un contesto probabilistico, si è capito che l'affermazione "se n è abbastanza grande allora X" può anche essere interpretato nel senso "X diventa sempre più probabile che sia vero, come n cresce di grandi dimensioni" .
    Tuttavia, questa interpretazione esce dalla mia finestra non appena dicono che ciò accade "sempre". La terminologia corretta qui sarebbe stata quella di dire che ciò accade " con alta probabilità " 1 .


  • n>n0

Ma una volta che capisci la letteratura, ottieni quello che stanno cercando di dire.

(Nota a margine: per inciso, questo è esattamente uno dei problemi costanti che molte persone hanno con Wikipedia. Spesso, è possibile capire cosa stanno dicendo solo se si conosce già il materiale, quindi è utile solo come riferimento o come promemoria , non come materiale autodidatta.)

1 Per gli altri pedanti (ciao!), Sì, il termine ha un significato più specifico di quello a cui mi sono collegato. Il termine tecnico più lento che probabilmente desideriamo qui è "asintoticamente quasi sicuramente" . Vedi qui .


αα

@ Henry: Oh spara, hai ragione! L'ho scritto così in fretta che non mi sono fermato a pensare. Grazie mille! L'ho risolto. :)
Mehrdad,

3

Il mio esempio preferito è il numero di dita per sesso. La stragrande maggioranza delle persone ha 10 dita. Alcuni hanno perso le dita a causa di incidenti. Alcuni hanno dita extra.

Non so se gli uomini hanno più dita delle donne (in media). Tutte le prove facilmente disponibili suggeriscono che uomini e donne hanno entrambi 10 dita.

Tuttavia, sono fiducioso che se avessi fatto un censimento di tutti gli uomini e tutte le donne, avrei imparato che un genere ha più dita (in media) dell'altro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.