Dimensione relativa dei valori di p a diverse dimensioni del campione


13

Come cambia la dimensione relativa del valore di una p a diverse dimensioni del campione? Come se avessi a per una correlazione e poi a avessi lo stesso valore p di 0.20, quale sarebbe la dimensione relativa del valore p per il secondo test, rispetto al valore p originale quando ?p=0.20n=45n=120n=45


1
Spiegare il senso in cui si stanno modificando le dimensioni del campione. Stai cercando di confrontare i valori di p per due esperimenti indipendenti di cose diverse o stai forse contemplando la possibilità di aumentare un campione di dimensioni raccogliendo osservazioni indipendenti aggiuntive? 4512045
whuber

Sfortunatamente non mi è stata data più informazione di quella nella domanda

1
Questo è per qualche argomento?
Glen_b

Risposte:


19

Considera di lanciare una moneta che sospetti possa venire fuori testa troppo spesso.

Esegui un esperimento, seguito da un test di ipotesi a una coda. In dieci tiri ottieni 7 teste. Qualcosa di almeno il 50% potrebbe facilmente accadere con una moneta giusta. Niente di insolito lì.

Se invece, ottenessi 700 teste in 1000 lanci, un risultato almeno altrettanto giusto che sarebbe sorprendente per una moneta giusta.

Quindi il 70% delle teste non è affatto strano per una moneta giusta nel primo caso e molto strano per una moneta giusta nel secondo caso. La differenza è la dimensione del campione.

All'aumentare della dimensione del campione, diminuisce la nostra incertezza su dove potrebbe essere la media della popolazione (la proporzione di teste nel nostro esempio). Quindi campioni più grandi sono coerenti con intervalli più piccoli di possibili valori della popolazione - più valori tendono a diventare "esclusi" man mano che i campioni diventano più grandi.

Più dati abbiamo, più precisamente possiamo stabilire dove potrebbe essere la media della popolazione ... quindi un valore fisso della media che è sbagliato sembrerà meno plausibile man mano che le dimensioni del nostro campione diventano grandi. Cioè, i valori di p tendono a diventare più piccoli all'aumentare della dimensione del campione, a meno che non sia veroH0 .


Grazie :) E come si adatta a ottenere lo stesso valore p (non più piccolo) con una dimensione del campione maggiore?

1
La tua domanda non dice che il valore p è lo stesso, dice che hai pensato che sarebbe stato lo stesso. Si tratta di una nuova domanda o non eri particolarmente incerto su ciò che volevi? In ogni caso, può succedere - se il campione più grande è abbastanza vicino a quello che ti aspetteresti dal nulla per renderlo tale. Immagina di avere 8 teste su 25 tiri (32% di teste), ma 14 teste su 39 tiri (circa il 36% di teste). Il valore p per un test di è quasi lo stesso. P(H)=0.5
Glen_b

1
La tua domanda modificata ora è molto confusa. Pensavo di aver capito cosa stavi chiedendo, ora non ho assolutamente idea di cosa tu stia parlando. (Apparentemente quello che sembrava non fosse quello che stava chiedendo.)
Glen_b

1
Non so cosa si intende con la frase "valore p relativo" lì.
Glen_b

1
Per l'editore anonimo: 700 teste in 1000 lanci è molto più del necessario per stabilire il punto; sono già 12,65 deviazioni standard dalla media. Corrisponde a un valore p di . È già un esempio estremo, quindi moltiplicare tutto per 1000 non aiuta a migliorare questo punto. Anche 70 su 100 sarebbero più che sufficienti. 1.7×1037
Glen_b -Reststate Monica,

8

Sono d'accordo con @Glen_b, voglio solo spiegarlo da un altro punto di vista.

Mettiamo l'esempio della differenza di mezzi in due popolazioni. Rifiutare equivale a dire che 0 non è nell'intervallo di confidenza per la differenza di mezzi. Questo intervallo si riduce con n (per definizione), quindi diventerà sempre più difficile per qualsiasi punto (in questo caso, lo zero) essere nell'intervallo man mano che n cresce. Poiché il rifiuto per intervallo di confidenza è matematicamente equivalente al rifiuto per valore p, il valore p si riduce con n.H0

Verrà il momento in cui otterrai un intervallo come che indicherà che la prima popolazione ha effettivamente una media più grande della seconda popolazione, ma questa differenza è così piccola che non ti dispiacerebbe. Sarà respingere , ma questo rifiuto abituato media qualsiasi cosa nella vita reale. Questo è il motivo per cui i valori p non sono sufficienti per descrivere un risultato. Bisogna sempre dare una certa misura del FORMATO della differenza osservata.[0.0001,0.0010]H0


3

Il valore per un di di cui una determinata diversa da zero è effettivamente zero nella popolazione diminuirà all'aumentare della dimensione del campione. Questo perché un campione più ampio che fornisce prove coerenti di tale effetto diverso da zero sta fornendo più prove rispetto allo zero rispetto a un campione più piccolo. Un campione più piccolo offre maggiori possibilità di errore di campionamento casuale per distorcere le stime delle dimensioni dell'effetto, come dimostra la risposta di @ Glen_b. La regressione alla media riduce l'errore di campionamento all'aumentare della dimensione del campione; una stima della dimensione dell'effetto basata sulla tendenza centrale di un campione migliora con la dimensione del campione seguendo il teorema del limite centrale . Pertantopp- vale a dire, la probabilità di ottenere più campioni della stessa dimensione e con dimensioni dell'effetto almeno altrettanto forti di quella del campione se li prelevi casualmente dalla stessa popolazione, supponendo che la dimensione dell'effetto in quella popolazione sia effettivamente zero - diminuisce della dimensione del campione aumenta e la dimensione dell'effetto del campione rimane invariata. Se la dimensione dell'effetto diminuisce o la variazione dell'errore aumenta all'aumentare della dimensione del campione, la significatività può rimanere invariata.

Ecco un altro semplice esempio: la correlazione tra e . Qui, Pearson è . Se duplico i dati e collaudo la correlazione di e , ancora, ma . Non ci vogliono molte copie ( ) per avvicinarsi a , mostrato qui:x={1,2,3,4,5}y={2,1,2,1,3}r=.378,t(3)=.71,p=.53x={1,2,3,4,5,1,2,3,4,5}y={2,1,2,1,3,2,1,2,1,3}r=.378t(3)=1.15,p=.28nlimnp(n)=0


Quando fai riferimento al CLT, penso che tu abbia davvero intenzione di fare riferimento alla legge dei grandi numeri. Il CLT ci offre una normalità approssimativa della distribuzione del campionamento - che non menzionate affatto.
Dason,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.