Le differenze tra numeri distribuiti uniformemente sono distribuiti uniformemente?


22

Tiriamo un dado a 6 facce un gran numero di volte.

Calcolando la differenza (valore assoluto) tra un rotolo e il suo rotolo precedente, le differenze dovrebbero essere distribuite uniformemente?

Per illustrare con 10 rotoli:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

I diffvalori sarebbero distribuiti uniformemente?


13
Traccia un istogramma per avere almeno un senso
gunes,


Sembra fare i compiti ....
Manu H

@Manu H, ti assicuro che i giorni dei compiti sono alle mie spalle
HeyJude,

Risposte:


37

No, non è uniforme

Puoi contare le possibilità altrettanto probabili per le differenze assolute36

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

che fornisce una distribuzione di probabilità per le differenze assolute di

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas La tabella in questa risposta contraddice chiaramente la tua affermazione: ad esempio, mostra che solo una delle possibili differenze è 5 mentre 6 di queste sono 0. Poiché tutte e 36 le possibilità sono ugualmente probabili, non è uniforme.
whuber

13
@onurcanbektas Ti invito ancora una volta a contemplare il tavolo. Dato che ha solo due differenze assolute di 5, non è ovvio che non più di due differenze possono equivalere a 5?
whuber

14
@onurcanbektas Per differenze semplici (cioè con segni, quindi numeri interi da -5 a +5), la distribuzione è una distribuzione triangolare discreta simmetrica con la modalità (valore più probabile) a 0. Per differenze assolute come mostrato nella mia risposta, il la modalità è 1.
Henry,

2
Tuttavia, vale la pena notare che la differenza firmata modulo 6 è distribuita uniformemente.
Federico Poloni,

2
@FedericoPoloni Non è banalmente ovvio? Voglio dire, non ci ho mai pensato, prima di leggere il commento, ma è abbastanza ovvio che questo deve semplicemente essere vero
Cruncher,

21

Utilizzando solo gli assiomi più elementari su probabilità e numeri reali, si può dimostrare un'affermazione molto più forte:

La differenza tra due valori casuali non costanti indipendenti distribuiti in modo identico non ha mai una distribuzione uniforme discreta.XY

(Una dichiarazione analoga per variabili continue è dimostrata in Uniform PDF della differenza di due rv .)

L'idea è che la possibilità che sia un valore estremo deve essere inferiore alla possibilità che sia zero, perché esiste un solo modo per (diciamo) massimizzare mentre ci sono molti modi per fare la differenza zero, perché e hanno la stessa distribuzione e quindi possono eguagliarsi a vicenda. Ecco i dettagliXYXYXYXY

Per prima cosa osserva che le ipotetiche due variabili e in questione possono raggiungere ciascuna solo un numero finito di valori con probabilità positiva, perché ci saranno almeno differenze distinte e una distribuzione uniforme assegna loro tutte le pari probabilità. Se è infinito, allora lo sarebbe anche il numero di possibili differenze con probabilità uguale e positiva, da cui la somma delle loro possibilità sarebbe infinita, il che è impossibile.XYnnn

Successivamente , poiché il numero di differenze è limitato, ce ne sarà una maggiore. La differenza più grande può essere raggiunta solo quando sottraendo il valore più piccolo di chiamata --let di esso e supponiamo che ha probabilità --from il più grande valore di --let di chiamata che quello con Poiché e sono indipendenti, la possibilità di questa differenza è il prodotto di queste possibilità,Ymq=Pr(Y=m)XMp=Pr(X=M).XY

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Infine , poiché e hanno la stessa distribuzione, ci sono molti modi in cui le loro differenze possono produrre il valore Tra questi vi sono i casi in cui e Poiché questa distribuzione non è costante, differisce da Ciò dimostra che questi due casi sono eventi disgiunti e quindi devono contribuire almeno un importo alla possibilità che sia zero; questo è,XY0.X=Y=mX=Y=M.mM.p2+q2XY

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Poiché i quadrati dei numeri non sono negativi, da cui deduciamo da che0(pq)2,()

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

mostrando che la distribuzione di non è uniforme, QED.XY

Modifica in risposta a un commento

Un'analisi simile delle differenze assoluteosserva che poiché e hanno la stessa distribuzione,Ciò richiede che studiamoLa stessa tecnica algebrica produce quasi lo stesso risultato, ma esiste la possibilità che eQuel sistema di equazioni ha la soluzione unica|XY|XYm=M.Pr(XY=|Mm|)=2pq.2pq=2pq+(pq)22pq+p2+q2=1.p=q=1/2corrispondente a una moneta giusta (un "dado a due facce"). A parte questa eccezione, il risultato per le differenze assolute è lo stesso di quello per le differenze, e per le stesse ragioni sottostanti già indicate: vale a dire, le differenze assolute di due variabili casuali iid non possono essere distribuite uniformemente quando ci sono più di due differenze distinte con probabilità positiva.

(fine della modifica)


Appliciamo questo risultato alla domanda, che chiede qualcosa di un po 'più complesso.

Modella ciascun tiro indipendente del dado (che potrebbe essere un dado ingiusto ) con una variabile casuale Le differenze osservate in questi rotoli sono i numeri Potremmo chiederci quanto siano uniformemente distribuiti questi numeri . Questa è davvero una domanda sulle aspettative statistiche: qual è il numero previsto di che è uguale a zero, per esempio? Qual è il numero previsto di uguale a ? Ecc. Ecc.Xi, i=1,2,,n.nΔXi=Xi+1Xi.n1ΔXiΔXi1

L'aspetto problematico di questa domanda è che non sono indipendenti: ad esempio, e coinvolgono lo stesso rotoloΔXiΔX1=X2X1ΔX2=X3X2X2.

Tuttavia, questa non è davvero una difficoltà. Poiché l'aspettativa statistica è additiva e tutte le differenze hanno la stessa distribuzione, se scegliamo qualsiasi valore possibile delle differenze, il numero previsto di volte in cui la differenza è uguale a nell'intera sequenza di rotoli è solo volte il numero atteso di volte la differenza è uguale a in una singola fase del processo. L'aspettativa in un solo passaggio è (per qualsiasi ). Queste aspettative saranno le stesse per tutti i (ovvero, uniformi ) se e solo se sono uguali per un singolokknn1kPr(ΔXi=k)ikΔXi. Ma abbiamo visto che nessun ha una distribuzione uniforme, anche quando il dado potrebbe essere distorto. Pertanto, anche in questo senso più debole delle frequenze previste, le differenze dei rulli non sono uniformi.ΔXi


@Michael Buono punto: ho risposto alla domanda come chiesto (che riguarda "differenze"), piuttosto che come illustrato (che si riferisce chiaramente a differenze assolute). Si applica la stessa tecnica: bisogna solo considerare le differenze massima e minima. Nel caso in cui queste siano le uniche due possibilità (insieme a zero), possiamo ottenere l'uguaglianza, che è da dove proviene il risultato di Bernoulli (mostrando che è l'unico esempio). (1/2)
whuber

Un'altra risposta che dimostra una versione particolare di questo è qui .
Ripristina Monica il

Grazie, @ Ben: avevo dimenticato quella discussione. Perché è un riferimento migliore, ora mi collego direttamente ad esso in questa risposta.
whuber

12

A livello intuitivo, un evento casuale può essere distribuito uniformemente solo se tutti i suoi risultati sono ugualmente probabili.

È così per l'evento casuale in questione: la differenza assoluta tra due tiri di dado?

In questo caso è sufficiente guardare agli estremi: quali sono i valori più grandi e più piccoli che questa differenza potrebbe assumere?

Ovviamente 0 è il più piccolo (stiamo osservando le differenze assolute e i tiri possono essere gli stessi), e 5 è il più grande ( 6vs 1).

Possiamo dimostrare che l'evento non è uniforme, dimostrando che 0è più o meno probabile che si verifichi 5.

A prima vista, ci sono solo due modi in cui si verificano 5: se il primo dado è 6 e il secondo 1, o viceversa . In quanti modi può verificarsi 0?


1
+1 Penso che questo arrivi al nocciolo della questione. Ho pubblicato una generalizzazione della domanda che alla fine si basa sulla stessa osservazione.
whuber

5

Come presentato da Henry, le differenze nelle distribuzioni distribuite uniformemente non sono distribuite uniformemente.

Per illustrare questo con dati simulati, possiamo usare uno script R molto semplice:

barplot(table(sample(x=1:6, size=10000, replace=T)))

inserisci qui la descrizione dell'immagine

Vediamo che questo produce davvero una distribuzione uniforme. Diamo ora un'occhiata alla distribuzione delle differenze assolute di due campioni casuali da questa distribuzione.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

inserisci qui la descrizione dell'immagine


6
Perché questo ha qualcosa a che fare con il CLT, che riguarda la distribuzione asintotica delle medie di un gran numero di valori iid?
whuber

2
Mi piace la connessione originariamente stabilita con CLT . Sia il numero di campioni da aggiungere (o sottrarre) dalla distribuzione uniforme originale. CLT implica che per grandi la distribuzione tenderà verso normale. Questo a sua volta implica che la distribuzione non può rimanere uniforme per nessun , come che è ciò che OP sta chiedendo. (Se questo non si spiega da sé, considera che se la somma fosse distribuita uniformemente quando , la reindicizzazione implicherebbe che è anche uniforme quando , ecc .nnn>1n=2n=2n=4n
Incluso

3
@Krubo La domanda originale pone sulla distribuzione delle differenze tra i tiri successivi di un dado. Il CLT non ha nulla da dire al riguardo. In effetti, non importa quante volte il dado viene lanciato, la distribuzione di tali differenze non si avvicinerà alla normalità.
whuber

Questa distribuzione tende ad uniformarsi quando il numero di facce del dado tende all'infinito? Non sono sicuro di come dimostrarlo, ma intuitivamente sembra che vada in quella direzione, ma non so se viene asintoticamente "bloccato" da qualche parte prima di appiattirsi abbastanza
Cruncher,

@Cruncher è possibile modificare facilmente il numero di facce del dado nel codice R. Più facce ci sono, più diventa evidente la natura delle scale della distribuzione. '1' è sempre il picco di quella scala e con differenze maggiori le probabilità si avvicinano allo zero. Inoltre, la differenza di "0" è nettamente più rara di "1". (almeno se il valore più piccolo del dado è '1')
LuckyPal

2

Altri hanno elaborato i calcoli, ti darò una risposta che mi sembra più intuitiva. Volete studiare la somma di due unifrom rv (Z = X + (-Y)), la distribuzione complessiva è il prodotto di convoluzione (discreto):

P(Z=z)=k=P(X=k)P(Y=zk)

Questa somma è piuttosto intuitiva: la probabilità di ottenere è la somma delle probabilità di ottenere qualcosa con X (annotato qui) e il complemento a con -Y.zkz

Dall'elaborazione del segnale, sappiamo come si comportano i prodotti convoluzione:

  • Il prodotto di convoluzione di due funzioni uniformi (due rettangoli) darà un triangolo. Questo è illustrato da Wikipedia per funzioni continue:

inserisci qui la descrizione dell'immagine

  • Puoi capire cosa succede qui: mentre sposta verso l'alto (la linea tratteggiata verticale) il dominio comune di entrambi i rettangoli si sposta verso l'alto e poi verso il basso, che corrisponde alla probabilità di ottenere .zz

  • Più in generale sappiamo che le uniche funzioni che sono stabili dalla convoluzione sono quelle della famiglia gaussiana. cioè Solo la distribuzione gaussiana è stabile per addizione (o più in generale, combinazione lineare). Questo significa anche che non si ottiene una distribuzione uniforme quando si combinano distribuzioni uniformi.

Per quanto riguarda il motivo per cui otteniamo tali risultati, la risposta sta nella scomposizione di Fourrier di tali funzioni. La trasformazione di Fourrier di un prodotto di convoluzione è il semplice prodotto delle trasformazioni di Fourrier di ciascuna funzione. Ciò fornisce collegamenti diretti tra i coefficienti di Fourrier delle funzioni rettangolo e triangolo.


Verifica la validità dei tuoi reclami e la logica della tua risposta. La domanda non è se la convoluzione di due distribuzioni uniformi sia uniforme: è se la convoluzione di una certa distribuzione e il suo rovesciamento possano essere uniformi. E ci sono molte più famiglie distributive rispetto al gaussiano che sono stabili sotto la convoluzione (standardizzazione modulo, ovviamente): vedi en.wikipedia.org/wiki/Stable_distribution
whuber

Hai ragione sulle distribuzioni stabili. Per la domanda, sono abbastanza sicuro che si tratti della differenza di due valori casuali con distribuzione uniforme (come indicato dal titolo). La domanda se la convoluzione di una certa distribuzione e il suo capovolgimento possa essere uniforme è più ampia di quella che viene posta qui.
lcrmorin,

1

Se ed sono due consecutivi tiri di dado, è possibile visualizzare (per ) come segue dove ogni colore corrisponde a un diverso valore di :xy|xy|=kk=0,1,2,3,4,5k

visualizzazione della differenza dei tiri di dado consecutivi

Come puoi facilmente vedere, il numero di punti per ciascun colore non è lo stesso; pertanto, le differenze non sono distribuite uniformemente.


0

Lascia che indichi la differenza e il valore del tiro, quindi DtXP(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

Quindi la funzione non è costante in . Ciò significa che la distribuzione non è uniforme.P(Dt=d)d

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.