Qualcuno può chiarire il concetto di una "somma di variabili casuali"


21

Nella mia classe di probabilità i termini "somme di variabili casuali" sono costantemente utilizzati. Tuttavia, sono bloccato su cosa significhi esattamente?

Stiamo parlando della somma di un mucchio di realizzazioni da una variabile casuale? In tal caso, non si aggiunge a un singolo numero? In che modo una somma di realizzazioni variabili casuali ci porta a una distribuzione o a una funzione cdf / pdf / di qualsiasi tipo? E se non si tratta di realizzazioni variabili casuali, che cosa viene aggiunto esattamente?


1
Per "realizzazioni di una variabile casuale" presumo tu intenda i valori effettivamente osservati. Ciò che viene sommato nella "somma delle variabili casuali" sono le variabili casuali prima che vengano osservate. Immagina di calcolare il peso delle prossime 5 persone per salire sull'ascensore. Non conosci i loro pesi (ancora) e quindi sono ciascuno una variabile casuale. Ma probabilmente vorresti sapere qualcosa sulla distribuzione della somma dei loro pesi.
Peter,

@PeterR Questo è ciò che non capisco. Come ha senso parlare dell'aggiunta di qualcosa che non ha ancora un valore? È un tipo metaforico di sommatoria?
Gosset,

1
Penso che il tuo problema sia che non capisci cos'è una variabile casuale. Se ottieni questo concetto, anche la somma arriverà facilmente.
Aksakal,

@Aksakal Il fatto che io abbia già pubblicato questa domanda ne è la prova? Forse se lo conosci, potresti chiarire il concetto?
Gosset,

Sono state date grandi risposte. Un altro esempio è la somma di due dadi, . Il risultato è chiaramente casuale (non sai in anticipo quale sarà la somma di entrambi i dadi). Sappiamo che X , Y U n i f ( 1 , 6 ) e indipendente. Si scopre che X + Y ha una distribuzione triangolare. X+YX,YUnif(1,6)X+Y
bdeonovic,

Risposte:


39

Un modello fisico e intuitivo di una variabile casuale è quello di scrivere il nome di ogni membro di una popolazione su uno o più foglietti di carta - "biglietti" - e mettere quei biglietti in una scatola. Il processo di miscelazione completa del contenuto della scatola, seguito dall'estrazione cieca di un biglietto - esattamente come in una lotteria - modella la casualità. Le probabilità non uniformi sono modellate introducendo un numero variabile di biglietti nel riquadro: più biglietti per i membri più probabili, meno per i meno probabili.

Una variabile casuale è un numero associato a ciascun membro della popolazione. (Pertanto, per coerenza, ogni ticket per un determinato membro deve avere lo stesso numero scritto su di esso.) Più variabili casuali sono modellate riservando spazi sui ticket per più di un numero. Noi di solito diamo quei nomi spazi come Y , e Z . La somma di quelle variabili casuali è la solita somma: riservare un nuovo spazio su ogni ticket per la somma, leggere i valori di X , Y , ecc. Su ciascun ticket e scrivere la loro somma in quel nuovo spazio. Questo è un modo coerente di scrivere numeri sui biglietti, quindi è un'altra variabile casuale.X, Y,ZX, Y,

figura

Questa figura mostra un riquadro che rappresenta una popolazione e tre variabili casuali X , Y e X + YΩ={α,β,γ}XYX+Y . Esso contiene sei biglietti: il tre per (blu) dargli una probabilità di 3 / 6 , i due per β (giallo) dargli una probabilità di 2 / 6 , e quello per γ (verde) dargli una probabilità di 1 / 6α3/6β2/6γ1/6. Per visualizzare ciò che è scritto sui biglietti, vengono mostrati prima di essere mescolati.

Il bello di questo approccio è che tutte le parti paradossali della domanda risultano essere corrette:

  • la somma delle variabili casuali è in effetti un singolo numero definito (per ciascun membro della popolazione),

  • tuttavia conduce anche a una distribuzione (data dalle frequenze con cui la somma appare nella casella), e

  • modella ancora efficacemente un processo casuale (perché i biglietti sono ancora estratti alla cieca dalla scatola).

In questo modo la somma può avere contemporaneamente un valore definito (dato dalle regole di addizione applicate ai numeri su ciascuno dei biglietti) mentre la realizzazione - che sarà un biglietto estratto dalla scatola - non ha valore fino a è effettuato.

Questo modello fisico di estrazione di biglietti da una scatola è adottato nella letteratura teorica e reso rigoroso con le definizioni di spazio campione (la popolazione), algebre sigma (con le relative misure di probabilità associate) e variabili casuali come funzioni misurabili definite nello spazio campione .

Questo resoconto delle variabili casuali viene elaborato, con esempi realistici, in "Cosa si intende per variabile casuale?" .


3
+1 posto esemplare. Spero non ti dispiaccia la domanda impertinente, ma in cosa è stata fatta l'illustrazione?
Glen_b -Restate Monica

4
@Glen_b PowerPoint :-). L'immagine di una scatola proviene da mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . I biglietti sono in grafica PowerPoint. (Non c'è nulla di impertinente in tali domande!) Ho raggruppato l'intero gruppo, incollato in Paint e usato per salvarlo come file .png.
whuber

Mi manca qualcosa, ma sembra che tu stia scrivendo più etichette numeriche su ciascun membro della popolazione. Tutti gli alfa hanno X = 1, Y = 2 e quindi X + Y = 3 .. X, Y e X + Y hanno esattamente la stessa distribuzione, spostati da un valore qui un valore lì, a causa di diversi
livelli

1
@whuber - dovrebbe avere frequenze scritte. Non esperto nei gerghi matematici per dire "misura di probabilità sottostante". comunque mi stai prendendo alla deriva. Sto cominciando a vedere come posso giocare con i numeri sui biglietti per dargli la distribuzione di probabilità desiderata. A livello superficiale questo approccio sembrava un gioco di parole con diverse "etichette" e quindi non lo vedeva chiaramente. sarebbe come la cinquantesima volta che mi hai aiutato in questo sito. grazie
MiloMinderbinder il

1
@Milo Prego. Vedo ora che stavi reagendo all'esempio in questa risposta piuttosto che all'esempio che ho dato nei commenti precedenti. L'esempio della risposta ha effettivamente tre diversi ticket con frequenze relative 1: 2: 3, e questo è tutto ciò che significa "misura di probabilità" in questo caso. Questo non è solo un gergo, però: c'è un profondo bisogno dei concetti sottostanti. Vedi, tra l'altro, stats.stackexchange.com/questions/199280 per alcuni bei conti.
whuber

4

non c'è segreto dietro questa frase, è semplice come puoi pensare: se X e Y sono due variabili casuali, la loro somma è X + Y e anche questa somma è una variabile casuale. Se X_1, X_2, X_3, ..., X_n e sono n variabili casuali, la loro somma è X_1 + X_2 + X_3 + ... + X_n e questa somma è anche una variabile casuale (e la realizzazione di questa somma è una singola numero, ovvero una somma di n realizzazioni).

Perché parli così tanto di somme di variabili casuali nella classe? Uno dei motivi è il (sorprendente) teorema del limite centrale: se sommiamo molte variabili casuali indipendenti, allora possiamo "prevedere" la distribuzione di questa somma (quasi) indipendentemente dalla distribuzione delle singole variabili nella somma! La somma tende a diventare una distribuzione normale e questa è la ragione probabile per cui osserviamo la distribuzione normale così spesso nel mondo reale.


3

rv è una relazione tra il verificarsi di un evento e un numero reale. Ad esempio, se piove il valore X è 1, se non è quindi 0. È possibile avere un altro valore Y uguale a 10 quando fa freddo e 100 quando fa caldo. Quindi, se piove e fa freddo, allora X = 1, Y = 10 e X + Y = 11.

I valori X + Y sono 10 (non piove a freddo); 11 (pioggia, freddo), 100 (non pioggia, caldo) e 110 (pioggia, caldo). Se calcoli le nostre probabilità degli eventi, otterrai PMF di questo nuovo camper X + Y.


1

X,YX+YΩ1×Ω2X,YΩ={Head,Tail}X(Head)=Y(Head)=1,X(Tail)=Y(Tail)=0(X+Y)X,YσX,Y

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.