Background e terminologia
Per essere perfettamente chiari di cosa stiamo discutendo, stabiliamo alcuni concetti e una terminologia. Un modello gradevole per le proporzioni è l'urna binaria: contiene palline colorate in argento ("successo") o fucsia ("fallimento"). La proporzione di sfere d'argento nell'urna è (ma questa non è la "proporzione" di cui parleremo). p
Questa urna fornisce un modo per modellare una prova di Bernoulli . Per ottenere una realizzazione, mescola accuratamente le palline e ne estrae ciecamente una, osservandone il colore. Per ottenere ulteriori realizzazioni, ricostituire prima la scatola restituendo la palla tirata, quindi ripetere la procedura un numero predeterminato di volte. La sequenza di realizzazioni può essere sintetizzata dal conte di suoi successi, . È una variabile casuale le cui proprietà sono completamente determinate da e . La distribuzione di è chiamata distribuzione binomiale . La proporzione (sperimentale o "campione") è il rapportoX n p X ( n , p ) X / nnXnpX(n,p)X/n.
Queste cifre sono grafici a barre delle distribuzioni di probabilità per varie proporzioni binomiali . Il più degno di nota è un modello coerente, indipendentemente da , in cui le distribuzioni diventano più strette (e le barre corrispondentemente più alte) mentre sposta da in giù.n p 1 / 2X/nnp1/2
La deviazione standard di è l' errore standard della proporzione menzionato nella domanda. Per ogni dato , questa quantità può dipendere solo da . Chiamiamolo . Cambiando i ruoli delle palle - chiama "fallimenti" quelli argento e quelli "fucsia" successi - è facile vedere che . Quindi la situazione in cui - cioè, deve essere speciale. La domanda riguarda come varia quando sposta da verso un valore più estremo, comen p se ( p ) se ( p ) = se ( 1 - p ) p = 1 - p p = 1 / 2 se ( p ) p 1 / 2 0X/nnpse(p)se(p)=se(1−p)p=1−pp=1/2se(p)p1/20.
Conoscenza vs comprensione
Poiché a tutti sono stati mostrati numeri come questi all'inizio della loro educazione, tutti "conoscono" l'ampiezza delle trame - che sono misurate da deve diminuire quando si allontana da . Ma quella conoscenza è davvero solo esperienza, mentre la domanda cerca una comprensione più profonda. Tale comprensione è disponibile da un'attenta analisi delle distribuzioni binomiali, come Abraham de Moivre intrapresa circa 300 anni fa. (Erano affini allo spirito di quelli che ho presentato in una discussione sul Teorema del limite centrale .) Penso, tuttavia, che alcune considerazioni relativamente semplici potrebbero essere sufficienti per sottolineare che le larghezze devono essere più ampie vicino a .p 1 / 2 p = 1 / 2se(p)p1/2p=1/2
Un'analisi intuitiva semplice
È chiaro che dovremmo aspettarci che la percentuale di successi nell'esperimento sia vicina a . L'errore standard riguarda quanto lontano da tale aspettativa potremmo ragionevolmente supporre che il risultato effettivo risiederà. Supponendo, senza alcuna perdita di generalità, che sia compreso tra e , cosa sarebbe necessario per aumentare da ? Tipicamente, intorno a delle palline disegnate in un esperimento c'erano argento e (quindi) intorno a erano fucsia. Per ottenere più palline d'argento, alcune di quelle inXpp 0 1 / 2 X / n p p n ( 1 - p ) n p n p p X p × ( 1 - p ) n X / n p ( 1 - p ) n / n = p ( 1 - p )X/np01/2X/nppn(1−p)npni risultati fucsia dovevano essere diversi. Quanto è probabile che questa possibilità possa operare in questo modo? La risposta ovvia è che quando è piccolo, non è mai molto probabile che disegneremo una palla d'argento. Pertanto, le nostre possibilità di disegnare palle d'argento anziché fucsia sono sempre basse. Potremmo ragionevolmente sperare che per pura fortuna, una proporzione degli esiti fucsia avrebbe potuto differire, ma sembra improbabile che molti di più di questi sarebbero cambiati. Pertanto, è plausibile che non varierebbe di molto più di . Equivalentemente, non varierebbe di molto più di .ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
Il Denouement
Appare quindi la combinazione magica . p(1−p) p = 1 / 2 p = 0 p = 1 Questo risolve praticamente la domanda: ovviamente questa quantità raggiunge il picco in e diminuisce a zero in o . Fornisce una giustificazione intuitiva ma quantitativa per affermazioni secondo cui "un estremo è più limitante dell'altro" o altri sforzi simili per descrivere ciò che sappiamo.p=1/2p=0p=1
Tuttavia, non è proprio il valore corretto: esso indica semplicemente il modo in cui, ci dice che quantità dovrebbe avere importanza per stimare la diffusione di . Abbiamo ignorato il fatto che anche la fortuna tende ad agire contro di noi: proprio come alcune sfere fucsia avrebbero potuto essere d'argento, alcune sfere d'argento potrebbero essere state fucsia. Tenere conto di tutte le possibilità rigorosamente può diventare complicato, ma il risultato è che invece di usare come limite ragionevole di quanto potrebbe deviare dalle sue aspettative , per tenere conto di tutti i possibili risultati che abbiamo correttamente prendere la radice quadrataX p ( 1 - p ) n X p n √p(1−p)Xp(1−p)nXpn nX/n √p(1−p)n−−−−−−−−√. (Per un resoconto più attento del perché, visitare ( https://stats.stackexchange.com/a/3904 ). Dividendo per , apprendiamo che le variazioni casuali della proporzione stessa dovrebbero essere nell'ordine di che è l'errore standard di .nX/nX/np(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n