La tua confusione sembra derivare dalla fusione di variabili casuali con le loro distribuzioni.
Per "disimparare" questa confusione, potrebbe essere utile fare un paio di passi indietro, svuotare la mente per un momento, dimenticare eventuali formalismi fantasiosi come spazi di probabilità e sigma-algebre (se aiuta, fingere di essere di nuovo alle elementari e non ho mai sentito parlare di nessuna di queste cose!) e pensa solo a ciò che una variabile casuale rappresenta fondamentalmente: un numero di cui non siamo sicuri .
Ad esempio, supponiamo di avere un dado a sei facce in mano. (Davvero. In effetti, ne ho un sacco intero.) Non l'ho ancora lanciato, ma sto per farlo, e decido di chiamare il numero che non ho ancora tirato su quel dado il nome " ".X
Cosa posso dire di questa , senza effettivamente lanciare il dado e determinarne il valore? Bene, posso dire che il suo valore non sarà , o . In effetti, posso dire con certezza che sarà un numero intero compreso tra e , inclusi, poiché questi sono gli unici numeri segnati sul dado. E poiché ho comprato questo sacco di dadi da un produttore rispettabile, posso essere abbastanza sicuro che quando lancio il dado e determino quale sia effettivamente il numero , è ugualmente probabile che sia uno di quei sei possibili valori, o quanto più vicino a quello come posso determinare.7 - 1 1X7- 1 16X1216X
In altre parole, la mia è una variabile casuale a valore intero distribuita uniformemente sull'insieme .{ 1 , 2 , 3 , 4 , 5 , 6 }X{ 1 , 2 , 3 , 4 , 5 , 6 }
OK, ma sicuramente tutto ciò che è ovvio, quindi perché continuo a sostenere cose così banali che sicuramente conosci già? È perché voglio fare un altro punto, che è anche banale ma, allo stesso tempo, di fondamentale importanza: posso fare matematica con questa , anche se non ne conosco ancora il valore!X
Ad esempio, posso decidere di aggiungerne uno al numero che lancerò sul dado e chiamare quel numero con il nome " ". Non saprò quale numero sarà questa , poiché non so quale sarà finché non avrò tirato il dado, ma posso ancora dire che sarà uno maggiore di , o in termini matematici, .Q Q X Q X Q = X + 1XQQXQXQ = X+ 1
E questa sarà anche una variabile casuale, perché non ne conosco ancora il valore; So solo che sarà uno più grande di . E perché so quali valori può assumere, e come probabile è quello di prendere ciascuno di questi valori, posso anche stabilire quelle cose per . E anche tu, abbastanza facilmente. Non avrai davvero bisogno di formalismi o calcoli fantasiosi per capire che sarà un numero intero compreso tra e e che è altrettanto probabile (supponendo che il mio dado sia equo e ben bilanciato come penso) da prendere uno di questi valori.X X Q Q 2 7QXXQQ27
Ma c'è di più! Potrei anche decidere di moltiplicare il numero che lancerò sul dado per tre e chiamare il risultato . E questa è un'altra variabile casuale, e sono sicuro che puoi capirne anche la distribuzione, senza dover ricorrere a integrali o convoluzioni o algebra astratta.R = 3 XXR = 3 X
E se volessi davvero, potrei persino decidere di prendere il numero ancora da determinare e di piegarlo, mandriarlo e mutilarlo dividerlo per due, sottrarne uno e squadrare il risultato. E il numero risultante è ancora un'altra variabile casuale; questa volta, non sarà né valorizzato per intero né distribuito uniformemente, ma puoi ancora capirne la distribuzione abbastanza facilmente usando solo la logica elementare e l'aritmetica.S = ( 1XS= ( 12X- 1 )2
OK, quindi posso definire nuove variabili casuali inserendo il mio tiro di dado sconosciuto in varie equazioni. E allora? Bene, ricordi quando ho detto che avevo un intero sacco di dadi? Consentitemi di prenderne un altro e chiamare il numero sul quale farò rotolare quel dado con il nome " ".YXY
Quei due dadi che ho preso dalla borsa sono praticamente identici - se li scambiassi quando non stavo guardando, non sarei in grado di dirlo - quindi posso tranquillamente presumere che questa avrà anche la stessa distribuzione di . Ma quello che voglio davvero fare è tirare entrambi i dadi e contare il numero totale di semi su ciascuno di essi . E quel numero totale di pips, che è anche una variabile casuale dal momento che non lo so ancora , chiamerò " ".X TYXT
Quanto sarà grande questo numero ? Ebbene, se è il numero di punti che scorrerà sulle prima matrice, e è il numero di punti che scorrerà sulle secondo dado, allora chiaramente sia la loro somma, ossia . E posso dire che, poiché e sono entrambi compresi tra uno e sei, deve essere almeno due e al massimo dodici. E poiché e sono entrambi numeri interi, anche deve essere chiaramente un numero intero.X Y T T = X + Y X Y T X Y TTXYTT= X+ YXYTXYT
Ma quanto è probabile che prenda ciascuno dei suoi possibili valori tra due e dodici? Sicuramente non è altrettanto probabile prenderli ciascuno - un po 'di sperimentazione rivelerà che è molto più difficile tirare un dodici su una coppia di dadi piuttosto che lanciare, diciamo, un sette.T
Per capirlo, lasciami indicare la probabilità che lanci il numero sul primo dado (quello il cui risultato ho deciso di chiamare ) con l'espressione . Allo stesso modo, indicherò la probabilità che lanci il numero sul secondo dado di . Naturalmente, se i miei dadi sono perfettamente equa ed equilibrata, quindi per qualsiasi e tra uno e sei, ma ci potrebbe anche prendere in considerazione la più generale caso in cui i dadi potrebbero effettivamente essere di parte, e più probabilità di tirare alcuni numeri rispetto ad altri.X Pr [ X = a ] b Pr [ Y = b ] Pr [ X = a ] = Pr [ Y = b ] = 1un'XPr [ X= a ]BPr [ Y= b ] abPr [ X= a ] = Pr [ Y= b ] = 16un'B
Ora, dal momento che i due tiri di dado saranno indipendenti (non sto di certo intenzione di barare e regolando uno dei quali basati su l'altro!), La probabilità che io rotolare sul primo stampo e al secondo semplicemente essere il prodotto di tali probabilità:b Pr [ X = un e Y = b ] = Pr [ X = un ] Pr [ Y = b ] .un' B
Pr [ X= a e Y= b ] = Pr [ X=a]Pr[Y=b].
(Nota che la formula sopra vale solo per coppie indipendenti di variabili casuali; certamente non lo sarebbe se sostituissimo sopra con, diciamo, !)QYQ
Ora, ci sono diversi possibili valori di e che potrebbero produrre lo stesso totale ; per esempio, potrebbe derivare altrettanto da e come da e , o anche da e . Ma se avessi già lanciato il primo dado e conoscessi il valore di , allora potrei dire esattamente quale valore dovrei tirare sul secondo dado per raggiungere un dato numero totale di pip.Y T T = 4 X = 1 Y = 3 X = 2 Y = 2 X = 3 Y = 1 XXYTT=4X=1Y=3X=2Y=2X=3Y=1X
In particolare, supponiamo che siamo interessati alla probabilità che , per qualche numero . Ora, se so dopo aver lanciato il primo dado che , allora potrei ottenere il totale tirando sul secondo dado. E, naturalmente, sappiamo già, senza tirare alcun dado, che la probabilità a priori di tirare sul primo dado sul secondo dado èc X = un T = c Y = c - un una c - un Pr [ X = un e Y = c - un ] = Pr [ X = un ] Pr [ Y = C - una ] .T=ccX=aT=cY=c−aac−a
Pr[X=a and Y=c−a]=Pr[X=a]Pr[Y=c−a].
Ma ovviamente, ci sono molti modi possibili per raggiungere lo stesso totale , a seconda di cosa finisco col lanciare sul primo dado. Per ottenere la probabilità totale di rotolamento pips su due dadi, ho bisogno di sommare le probabilità di tutti i diversi modi ho potuto rotolare quella totale. Ad esempio, la probabilità totale che lancerò un totale di 4 pips sui due dadi sarà:Pr [ T = c ] c Pr [ T = 4 ] = Pr [ X = 1 ] Pr [ Y = 3 ] + Pr [ X = 2 ] Pr [ Y = 2 ] + Pr [ X = 3 ] Pr [ Y = 1 ] + Pr [ X = 4 ]cPr[T=c]c
Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X= 2 ] Pr [ Y= 2 ] + Pr [ X= 3 ] Pr [ Y= 1 ] +Pr [ X= 4 ] Pr [ Y= 0 ] + ...
Nota che sono andato un po 'troppo in là con quella somma sopra: sicuramente non può essere ! Ma matematicamente non è un problema; dobbiamo solo definire la probabilità di eventi impossibili come (o o o ) come zero. E in questo modo, otteniamo una formula generica per la distribuzione della somma di due tiri di dado (o, più in generale, di due variabili casuali indipendenti con valore intero):0 Y = 0 Y = 7 Y = - 1 Y = 1Y0Y= 0Y= 7Y= - 1Y= 12
T= X+ Y⟹Pr [ T= c ] = ∑a ∈ ZPr [ X= a ] Pr [ Y= c - a ] .
E potrei benissimo fermare la mia esposizione qui, senza mai menzionare la parola "convoluzione"! Ma ovviamente, se ti capita di sapere come appare una convoluzione discreta , potresti riconoscerne uno nella formula sopra. E questo è un modo abbastanza avanzato per affermare il risultato elementare derivato sopra: la funzione di massa di probabilità della somma di due variabili casuali con valore intero è la convoluzione discreta delle funzioni di massa di probabilità dei sommari.
E ovviamente, sostituendo la somma con una massa integrale e di probabilità con una densità di probabilità , otteniamo un risultato analogo anche per variabili casuali distribuite continuamente. E estendendo sufficientemente la definizione di una convoluzione, possiamo persino farla applicare a tutte le variabili casuali, indipendentemente dalla loro distribuzione - anche se a quel punto la formula diventa quasi una tautologia, poiché avremo praticamente definito la convoluzione di due le distribuzioni di probabilità arbitrarie sono la distribuzione della somma di due variabili casuali indipendenti con tali distribuzioni.
Ma anche così, tutta questa roba con convoluzioni e distribuzioni e PMF e PDF è in realtà solo un insieme di strumenti per calcolare cose su variabili casuali. Gli oggetti fondamentali che stiamo calcolando le cose riguardo sono le variabili aleatorie stessi, che in realtà sono solo i numeri i cui valori non siamo sicuri circa .
E inoltre, quel trucco di convoluzione funziona solo per somme di variabili casuali, comunque. Se volessi sapere, diciamo, la distribuzione di o , dovresti capirlo usando metodi elementari e il risultato non sarebbe una convoluzione.V = X YU= XYV= XY
Addendum: se desideri una formula generica per calcolare la distribuzione della somma / prodotto / esponenziale / qualunque combinazione di due variabili casuali, ecco un modo per scriverne una: dove sta per un'operazione binaria arbitraria e è una parentesi Iverson , ovvero⊙ [ a = b ⊙ c ] [ a = b ⊙ c ] = { 1 se a = b ⊙ c , e 0 altrimenti .
A=B⊙C⟹Pr[A=a]=∑b,cPr[B=b and C=c][a=b⊙c],
⊙[a=b⊙c][a=b⊙c]={10if a=b⊙c, andotherwise.
(La generalizzazione di questa formula per variabili casuali non discrete viene lasciata come un esercizio di formalismo prevalentemente inutile. Il caso discreto è abbastanza sufficiente per illustrare l'idea essenziale, con il caso non discreto che aggiunge solo un mucchio di complicazioni irrilevanti.)
Puoi verificare che questa formula funzioni davvero, ad esempio per l'addizione e che, nel caso speciale dell'aggiunta di due variabili casuali indipendenti , è equivalente alla formula di "convoluzione" fornita in precedenza.
Naturalmente, in pratica, questa formula generale è molto meno utile per il calcolo, poiché comporta una somma su due variabili illimitate invece di una sola. Ma a differenza della formula a somma singola, funziona per funzioni arbitrarie di due variabili casuali, anche non invertibili, e mostra anche esplicitamente l'operazione invece di mascherarla come inversa (come la formula "convoluzione" nasconde l'aggiunta come sottrazione).⊙
Ps. Ho appena lanciato i dadi. Si scopre che e , il che implica che , , , , e . Ora sapete. ;-)Y = 6 Q = 6 R = 15 S = 2,25 T = 11 U = 30 V = 15625X=5Y=6Q=6R=15S=2.25T=11U=30V=15625