Ci sono già alcune risposte eccellenti a questa domanda, ma voglio rispondere perché l'errore standard è quello che è, perché usiamo come caso peggiore e come l'errore standard varia con .np=0.5n
Supponiamo che facciamo un sondaggio di un solo elettore, chiamiamolo 1 o il suo elettore e chiediamo "voterai per il Partito Viola?" Possiamo codificare la risposta come 1 per "sì" e 0 per "no". Diciamo che la probabilità di un "sì" è . Ora abbiamo una variabile casuale binaria che è 1 con probabilità e 0 con probabilità . Diciamo che è una variabile di Bernouilli con probabilità di successo , che possiamo scrivere . L'atteso, o medio,X 1 p 1 - p X 1 p X 1 ∼ B e r n o u i l l i ( p ) X 1 E ( X 1 ) = ∑ x P ( X 1 = x ) x X 1 1 - p p E ( X 1 ) = 0 ( 1 - ppX1p1−pX1pX1∼Bernouilli(p)X1E(X1)=∑xP(X1=x)xX1. Ma ci sono solo due risultati, 0 con probabilità e 1 con probabilità , quindi la somma è solo . Fermati e pensa. Questo in realtà sembra del tutto ragionevole - se c'è una probabilità del 30% di elettore 1 a sostegno del Partito Viola, e abbiamo codificato la variabile come 1 se dicono "sì" e 0 se dicono "no", allora avremmo si aspetta che sia in media 0,3.1−ppX 1E(X1)=0(1−p)+1(p)=pX1
Pensiamo cosa succede, . Se quindi e se quindi . Quindi in effetti in entrambi i casi. Poiché sono uguali, devono avere lo stesso valore atteso, quindi . Questo mi dà un modo semplice per calcolare la varianza di una variabile di Bernouilli: io uso e quindi la deviazione standard è .X 1 = 0 X 2 1 = 0 X 1 = 1 X 2 1 = 1 X 2 1 = X 1 E ( X 2 1 ) = p V a r ( X 1 ) = E ( X 2 1 ) - E ( X 1 ) 2 = p - p 2 =X1X1=0X21=0X1=1X21=1X21=X1E(X21)=pσ X 1 = √Var(X1)=E(X21)−E(X1)2=p−p2=p(1−p)σX1=p(1−p)−−−−−−−√
Ovviamente voglio parlare con altri elettori - chiamiamoli elettore 2, elettore 3, fino all'elettore . Supponiamo che abbiano tutti la stessa probabilità di sostenere il Partito Viola. Ora abbiamo variabili Bernouilli, da , a , con ogni per da 1 a . Hanno tutti la stessa media, e varianza, .p n X 1 X 2 X n X i ∼ B e r n o u l l i ( p ) i n p p ( 1 - p )npnX1X2XnXi∼Bernoulli(p)inpp(1−p)
Mi piacerebbe scoprire quante persone nel mio campione hanno detto "sì", e per fare ciò posso solo aggiungere tutta la . Scriverò . Posso calcolare il valore medio o atteso di usando la regola che se tali aspettative esistono e si estende che a . Ma sto sommando di quelle aspettative, e ognuna è , quindi ottengo in totale che X = ∑ n i = 1 X i X E ( X + Y ) = E ( X ) + E ( Y ) E ( X 1 + X 2 + … + X n ) = E ( X 1 ) + E ( X 2 ) + … + E ( X n )XiX=∑ni=1XiXE(X+Y)=E(X)+E(Y)E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(Xn)p E ( X ) = n p n pnpE(X)=np. Fermati e pensa. Se sondaggio 200 persone e ognuna ha una probabilità del 30% di dire che sostengono il Partito Viola, ovviamente mi aspetterei che 0,3 x 200 = 60 persone diano "sì". Quindi la formula sembra giusta. Meno "ovvio" è come gestire la varianza.np
V'è una regola che dice che
, ma posso usare solo se le mie variabili aleatorie sono indipendenti l'uno dall'altro . Quindi, facciamo questo assunto, e con una logica simile a prima che io possa vedere che . Se una variabile è la somma di prove di Bernoulli indipendenti , con identica probabilità di successo , allora diciamo che ha una distribuzione binomiale, . Abbiamo appena dimostrato che la media di tale distribuzione binomiale è e la varianza è .V a r ( X ) = n p ( 1 - p ) X n p X X ∼
Var(X1+X2+…+Xn)=Var(X1)+Var(X2)+…+Var(Xn)
Var(X)=np(1−p)Xn pXn p n p ( 1 - p )X∼Binomial(n,p)npnp(1−p)
Il nostro problema originale era come stimare dal campione. Il modo ragionevole di definire il nostro stimatore è . Ad esempio, 64 su un campione di 200 persone hanno dichiarato "sì", stimeremmo che 64/200 = 0,32 = 32% delle persone afferma di sostenere il Partito Viola. Si può vedere che è una versione "ridotta" del nostro numero totale di sì-elettori, . Ciò significa che è ancora una variabile casuale, ma non segue più la distribuzione binomiale. Possiamo trovare la sua media e varianza, perché quando ridimensioniamo una variabile casuale di un fattore costante , obbedisce alle seguenti regole: (quindi la media scala con lo stesso fattore ) ep = X / n p X k E ( k X ) = k E ( X ) k V a r ( k X ) = k 2 V a r ( X ) k 2 c m 2pp^=X/np^XkE(kX)=kE(X)kVar(kX)=k2Var(X) . Nota come la varianza si ridimensiona di . Questo ha senso quando sai che in generale, la varianza viene misurata nel quadrato di qualsiasi unità in cui viene misurata la variabile: non applicabile qui, ma se la nostra variabile casuale fosse stata un'altezza in cm, la varianza sarebbe in che si ridimensionano diversamente: se raddoppiate le lunghezze, quadruplicate l'area.k2cm2
Qui il nostro fattore di scala è . Questo ci dà . Questo è fantastico! In media, il nostro stimatore è esattamente quello che "dovrebbe" essere, la vera (o popolazione) probabilità che un elettore casuale dica che voteranno per il Partito Viola. Diciamo che il nostro stimatore è imparziale . Ma mentre è corretto in media, a volte sarà troppo piccolo, a volte troppo alto. Possiamo vedere quanto è probabile che sia sbagliato osservando la sua varianza. . La deviazione standard è la radice quadrata, E( p )=11n p Var( p )=1E(p^)=1nE(X)=npn=pp^ √Var(p^)=1n2Var(X)=np(1−p)n2=p(1−p)np(1−p)n−−−−−√e poiché ci dà un'idea di quanto male sarà il nostro stimatore (è effettivamente un errore quadratico medio radice , un modo per calcolare l'errore medio che considera ugualmente cattivi gli errori positivi e negativi, quadrandoli prima della media) , di solito viene chiamato errore standard . Una buona regola empirica, che funziona bene per campioni di grandi dimensioni e che può essere trattata in modo più rigoroso utilizzando il famoso teorema del limite centrale , è che la maggior parte delle volte (circa il 95%) la stima sarà errata con meno di due errori standard.
Poiché appare nel denominatore della frazione, i valori più alti di - campioni più grandi - riducono l'errore standard. Questa è una grande notizia, come se volessi un piccolo errore standard, ho solo fatto in modo che la dimensione del campione fosse abbastanza grande. La cattiva notizia è che è all'interno di una radice quadrata, quindi se quadruplo la dimensione del campione, dimezzerei solo l'errore standard. Errori standard molto piccoli coinvolgeranno campioni molto grandi, quindi costosi. C'è un altro problema: se voglio indirizzare un particolare errore standard, diciamo 1%, allora devo sapere quale valore di usare nel mio calcolo. Potrei usare valori storici se ho passato i dati di polling, ma vorrei prepararmi per il peggior caso possibile. Quale valore din p pnnppè più problematico? Un grafico è istruttivo.
L'errore standard (più alto) nel caso peggiore si verificherà quando . Per dimostrare che potrei usare il calcolo, ma qualche algebra del liceo farà il trucco, purché io sappia come " completare il quadrato ". p=0.5
p(1−p)−−−−−−−√=p−p2−−−−−√=14−(p2−p+14)−−−−−−−−−−−−−−√=14−(p−12)2−−−−−−−−−−−√
L'espressione è che le parentesi sono quadrate, quindi restituirà sempre una risposta zero o positiva, che viene quindi tolta da un quarto. Nel peggiore dei casi (errore standard di grandi dimensioni) viene rimosso il meno possibile. So che il minimo che può essere sottratto è zero e ciò si verificherà quando , quindi quando . Il risultato di ciò è che ottengo errori standard più grandi quando provo a stimare il sostegno per, ad esempio, i partiti politici vicino al 50% dei voti, e errori standard più bassi nella stima del supporto per proposizioni che sono sostanzialmente più o sostanzialmente meno popolari di così. In effetti la simmetria del mio grafico e della mia equazione mi mostrano che otterrei lo stesso errore standard per le mie stime di supporto del Partito Viola, sia che avessero il 30% di supporto popolare o il 70%.p=1p−12=0p=12
Quindi, quante persone devo sondare per mantenere l'errore standard al di sotto dell'1%? Ciò significherebbe che, nella stragrande maggioranza delle volte, la mia stima sarà entro il 2% della proporzione corretta. Ora so che l'errore standard nel caso peggiore è che mi dà e così . Ciò spiegherebbe perché vedi migliaia di voti.√0.25n−−−√=0.5n√<0.01n>2500n−−√>50n>2500
In realtà un errore di basso livello non è una garanzia di una buona stima. Molti problemi nel polling sono di natura pratica piuttosto che teorica. Ad esempio, ho ipotizzato che il campione fosse di elettori casuali ciascuno con la stessa probabilità , ma prelevare un campione "casuale" nella vita reale è irto di difficoltà. Potresti provare a fare sondaggi telefonici o online, ma non solo non tutti hanno un telefono o un accesso a Internet, ma coloro che non hanno demografie (e intenzioni di voto) molto diverse da quelli che lo fanno. Per evitare di introdurre una distorsione nei risultati, le società di sondaggi eseguono effettivamente tutti i tipi di ponderazione complicata dei loro campioni, non la semplice media∑ X ip∑Xinche ho preso. Inoltre, le persone mentono ai sondaggisti! I diversi modi in cui i sondaggisti hanno compensato questa possibilità sono, ovviamente, controversi. Puoi vedere una varietà di approcci nel modo in cui le compagnie di polling hanno affrontato il cosiddetto fattore Shy Tory nel Regno Unito. Un metodo di correzione riguardava il modo in cui le persone hanno votato in passato per giudicare quanto sia plausibile la loro pretesa intenzione di voto, ma si scopre che anche quando non mentono, molti elettori semplicemente non riescono a ricordare la loro storia elettorale . Quando hai a che fare con queste cose, è francamente molto scarso portare "l'errore standard" allo 0,00001%.
Per finire, ecco alcuni grafici che mostrano come la dimensione del campione richiesta - secondo la mia analisi semplicistica - sia influenzata dall'errore standard desiderato e quanto sia cattivo il valore del "caso peggiore" di rispetto alle proporzioni più suscettibili. Ricorda che la curva per sarebbe identica a quella per causa della simmetria del grafico precedente di p=0.5p=0.7p=0.3p(1−p)−−−−−−−√