Cosa si intende per "variabile casuale"?


Risposte:


35

Una variabile casuale è una variabile il cui valore dipende da eventi sconosciuti. Possiamo riassumere gli eventi sconosciuti come "stato", e quindi la variabile casuale è una funzione dello stato.

Esempio:

Supponiamo di avere tre tiri di dado ( , , ). Quindi lo stato .D1D2D3S=(D1,D2,D3)

  1. Una variabile casuale è il numero di 5 secondi. Questo è:X

X=(D1=5?)+(D2=5?)+(D3=5?)
  1. Un'altra variabile casuale è la somma dei tiri di dado. Questo è:Y

Y=D1+D2+D3

Grazie per la risposta chiara e concisa. Solleva una domanda sullo scopo di separare lo stato sconosciuto dal risultato (suppongo che questo sia il modo in cui il dominio e l'intervallo della "variabile casuale" sono chiamati nella teoria della probabilità). Sembra che venga chiamato lo stato sconosciuto a sample, che ho chiesto di distinguere dai risultati . Perché è necessario introdurre una funzione e chiamarla variabile casuale, sebbene sia assolutamente deterministica e per nulla variabile? Perché non puoi campionare il risultato immediatamente?
Val

2
Quando gli "eventi" diventano "noti", cosa succede alla variabile casuale? Secondo questa risposta, non può più esistere! La dipendenza da questa risposta su idee nebulose come "conosciute" - che è puramente soggettiva - la rende meno che soddisfacente come definizione o spiegazione di variabili casuali.
whuber

1
L'inglese @whuber e altri linguaggi umani sono necessariamente imprecisi. Sembra che tu stia effettivamente scegliendo la parola "dipende", non "conosciuta". "è una funzione di" è più preciso, ma poi "eventi sconosciuti" è vago e quindi i matematici definiscono uno "spazio di probabilità", "sigma algebra", "funzioni misurabili", ecc. Se hai bisogno di un trattamento più rigoroso, Wikipedia ce l'
Paul

1
@whuber Mentre wikipedia si precipita nel gergo matematico per ottenere precisione, noto che la tua risposta, un esempio di laico decente di tutto ciò, mentre una lettura utile, richiede circa 16 paragrafi per essere eseguita. Ma cosa dire a uno studente che desidera una risposta che richiede 5 secondi per leggere? I clienti apprezzano la brevità nelle definizioni.
Paul

5
È una funzione misurabile con valori reali su uno spazio di probabilità. Con ciascuno di questi termini tecnici - "misurabile", "funzione di valore reale" e "spazio di probabilità", ho stimato di aver perso il 90% del pubblico potenziale, lasciando solo lo 0,1% a comprendere e apprezzare la definizione. Per inciso, questa è puramente una definizione matematica. È inutile finché non si è specificato come può essere applicato a un vero problema statistico, ma almeno è corretto (se non del tutto generale).
whuber

69

introduzione

Nel pensare a un recente commento, noto che tutte le risposte finora soffrono dell'uso di termini indefiniti come "variabile" e termini vaghi come "sconosciuto" o fanno appello a concetti matematici tecnici come "funzione" e "spazio di probabilità". Cosa dovremmo dire alla persona non matematica che vorrebbe una definizione semplice, intuitiva, ma accurata di "variabile casuale"? Dopo alcuni preliminari che descrivono un semplice modello di fenomeni casuali, fornisco una definizione tale che sia abbastanza breve da adattarsi a una linea. Poiché potrebbe non soddisfare appieno i cognoscenti , un successivo spiega come estenderlo alla solita definizione tecnica.

Biglietti in una scatola

Un modo per avvicinarsi all'idea alla base di una variabile casuale è fare appello al modello di casualità dei ticket-in-a-box . Questo modello sostituisce un esperimento o un'osservazione con una scatola piena di biglietti. Su ogni biglietto è scritto un possibile esito dell'esperimento. (Un risultato può essere semplice come "teste" o "code" ma in pratica è una cosa più complessa, come una cronologia dei prezzi delle azioni, una registrazione completa di un lungo esperimento o la sequenza di tutte le parole in un documento .) Tutti i possibili risultati compaiono almeno una volta tra i biglietti; alcuni risultati possono apparire su molti ticket.

Invece di condurre effettivamente l'esperimento, immaginiamo accuratamente - ma alla cieca - mescolare tutti i biglietti e selezionarne solo uno. Se possiamo dimostrare che il vero esperimento dovrebbe comportarsi come se fosse condotto in questo modo, allora abbiamo ridotto un esperimento del mondo reale potenzialmente complicato (e costoso e lungo) a un esperimento di pensiero semplice, intuitivo (o "modello statistico" "). La chiarezza e la semplicità offerte da questo modello consentono di analizzare l'esperimento.

Un esempio

Esempi standard riguardano i risultati del lancio di monete e dadi e del disegno di carte da gioco. Questi sono in qualche modo fonte di distrazione per la loro banalità, quindi per illustrare, supponiamo che siamo preoccupati per il risultato delle elezioni presidenziali degli Stati Uniti nel 2016. Come una (piccola) semplificazione, assumerò che uno dei due principali partiti - Repubblicano (R) o Democratic (D) - vincerà. Perché (con le informazioni attualmente disponibili) il risultato è incerto, immaginiamo di mettere i biglietti in una scatola: alcuni con "R" scritto su di essi e altri con "D". Il nostro modello di risultato è quello di estrarre esattamente un biglietto da questo riquadro.

Manca qualcosa: non abbiamo ancora stabilito quanti biglietti ci saranno per ogni risultato. In effetti, scoprirlo è il problema principale della statistica: in base alle osservazioni (e alla teoria), cosa si può dire delle proporzioni relative di ciascun risultato nel riquadro?

(Spero sia chiaro che le proporzioni di ogni tipo di biglietto nella scatola determinano le sue proprietà, piuttosto che i numeri effettivi di ciascun biglietto. Le proporzioni sono definite - come al solito - per essere il conteggio di ogni tipo di biglietto diviso per il numero totale di biglietti. Ad esempio, una scatola con un biglietto "D" e un biglietto "R" si comporta esattamente come una scatola con un milione di biglietti "D" e un milione di biglietti "R", perché in entrambi i casi ogni tipo è Il 50% di tutti i biglietti e quindi ognuno ha il 50% di possibilità di essere estratto quando i biglietti sono accuratamente miscelati.)

Rendere il modello quantitativo

Ma non perseguiamo questa domanda qui, perché siamo vicini al nostro obiettivo di definire una variabile casuale. Il problema con il modello finora è che non è quantificabile, mentre vorremmo essere in grado di rispondere a domande quantitative con esso. E non intendo nemmeno questioni insignificanti, ma domande reali e pratiche come "se la mia azienda ha investito un miliardo di euro nello sviluppo di combustibili fossili offshore negli Stati Uniti, quanto cambierà il valore di questo investimento a seguito delle elezioni del 2016 ?" In questo caso il modello è così semplice che non c'è molto che possiamo fare per ottenere una risposta realistica a questa domanda, ma potremmo arrivare fino a consultare il nostro staff economico e chiedere le loro opinioni sui due possibili risultati:

  1. Se vincono i democratici, quanto cambierà l'investimento? (Supponiamo che la risposta sia dollari.)d

  2. Se i repubblicani vincono, quanto cambierà? (Supponiamo che la risposta sia dollari.)r

Le risposte sono numeri. Per usarli nel modello, chiederò al mio staff di esaminare tutti i biglietti nella scatola e su ogni biglietto "D" per scrivere " dollari" e su ogni biglietto "R" per scrivere "dr

Questo modello ci aiuta a rispondere ad ulteriori domande sull'investimento. Ad esempio, quanto dovremmo essere incerti sul valore dell'investimento ? Sebbene esistano (semplici) formule matematiche per questa incertezza, potremmo riprodurre le risposte in modo ragionevolmente accurato semplicemente usando il nostro modello ripetutamente - forse un migliaio di volte - per vedere quali tipi di risultati si verificano effettivamente e misurare la loro diffusione. Un modello "ticket-in-a-box" ci consente di ragionare quantitativamente su risultati incerti.

Variabili casuali

dr

Una variabile casuale è un modo coerente per scrivere numeri sui biglietti in una scatola.

XYωXωX(ω)XX(D)=dX(R)=rXXX

X

X


Successivamente: sulla misurabilità

Quando la definizione di variabile casuale è accompagnata dall'avvertenza "misurabile", ciò che il definitore ha in mente è una generalizzazione del modello ticket-in-a-box in situazioni con infiniti esiti possibili. (Tecnicamente, è necessario solo con esiti innumerevoli infiniti o in cui sono coinvolte probabilità irrazionali , e anche in quest'ultimo caso si possono evitare.) Con infiniti esiti è difficile dire quale sarebbe la proporzione del totale. Se ci sono infiniti biglietti "D" e infinitamente molti biglietti "R", quali sono le loro proporzioni relative? Non possiamo scoprirlo con una mera divisione di un infinito per un altro!

In questi casi, abbiamo bisogno di un modo diverso di specificare le proporzioni. Un insieme "misurabile" di biglietti è qualsiasi raccolta di biglietti nella casella per la quale è possibile definire la loro proporzione. Fatto ciò, il numero che abbiamo considerato una "proporzione" è chiamato "probabilità". (Non è necessario che ad ogni raccolta di biglietti sia associata una probabilità.)

XX(ω)abab


7
Per coloro che in precedenza non avevano familiarità con variabili casuali o modelli ticket-in-a-box, un breve tutorial interattivo sul mio sito Web all'indirizzo quantdec.com/envstats/notes/class_06/tutorial.htm fornisce pratica e alcuni concetti aggiuntivi.
whuber

2
Un esempio elaborato che illustra questi concetti appare su stats.stackexchange.com/a/68782 .
whuber

2
NB Ho il sospetto che molte persone usino il termine "popolazione" più o meno nel senso dei biglietti in una scatola. Evito quella terminologia perché sembra troppo che possiamo solo creare modelli di probabilità per il campionamento di popolazioni (fisiche) reali. Anche quando viene campionata una popolazione fisica, è raro che ci sia una perfetta corrispondenza uno-a-uno tra essa e i biglietti. Ad esempio, nessuno sarà mai in grado di enumerare il popolo cinese in vita il 1 ° gennaio 2014, in parte a causa delle incertezze su quando le persone nascono, quando muoiono e anche se sono cinesi.
whuber

4
@jsk L'introduzione a questa risposta spiega perché tale cura sembrava necessaria. Sebbene sia vero che altre due risposte in questo thread contengano una definizione corretta e completa ("una funzione misurabile da uno spazio di probabilità in uno spazio misurabile noto come spazio di stato"), tale definizione richiede implicitamente la comprensione di preliminari su algebre sigma, misure di probabilità, e funzioni misurabili. I lettori si lamenteranno "che è roba di livello universitario" .
whuber

4
@ user4205580 Per una definizione puramente matematica, la "coerenza" non è affatto necessaria, perché per il matematico, la variabile casuale è semplicemente "data". Per le applicazioni statistiche, come discusso qui, è una condizione importante, poiché molti dati non sono numerici: le variabili casuali devono essere costruite in modo appropriato per il modello e gli obiettivi analitici. Puoi decidere tu stesso se esiste un valore per te in questa distinzione concettuale.
whuber

16

Informalmente, una variabile casuale è un modo per assegnare un codice numerico a ogni possibile risultato. *

Esempio 1

{H,T}

XX(H)=1X(T)=010

Esempio 2

{A,K,,2,A,K,,2,A,K,,2,A,K,,2}.

Nel bridge, un asso vale 4 punti carta alta, un re 3, una regina 2 e un jack 1. Ogni altra carta vale 0 punti.

YY(A)=4Y(J)=1Y(7)=0


HTA

* Formalmente una variabile casuale è una funzione che mappa ogni risultato (nello spazio campione) su un numero reale.


5
+1. Questa risposta arriva al punto, è corretta ed è chiara, evitando così le sciocchezze sui valori "sconosciuti" e "mutevoli" che pervadono le altre risposte in questo thread.
whuber

12

A differenza di una variabile normale, una variabile casuale non può essere sostituita con un singolo valore invariato. Piuttosto si possono affermare proprietà statistiche come la distribuzione della variabile casuale. La distribuzione è una funzione che fornisce la probabilità che la variabile prenda un determinato valore o rientri in un intervallo dati determinati parametri come la media o la deviazione standard.

Le variabili casuali possono essere classificate come discrete se la distribuzione descrive valori da un insieme numerabile, come gli interi. L'altra classificazione per una variabile casuale è continua e viene utilizzata se la distribuzione copre valori di un insieme non numerabile come i numeri reali.


2
Probabilmente è meglio non usare qui il termine "variabile normale" quando non si intende una variabile casuale normalmente distribuita.
Rob Hyndman,

Concordato. Anche se personalmente guarderei qualcuno divertente per alcuni secondi se dicessero "variabile normale" e non lancino la parola "casuale" o "distribuito" da qualche parte per suggerirmi che è quello di cui stavano discutendo. Ma sono anche un ingegnere e non uno statistico, quindi non uso tanta notazione specifica per dominio.
Sharpie,

7
Le variabili casuali possono essere classificate come discrete se non attirano l'attenzione su se stesse. Se sono semplicemente numerabili, diciamo discreti :-P Inoltre, intendi prescrivere piuttosto che prescrivere, ma penso che descrivere potrebbe essere più appropriato. Bella risposta, comunque - si spera che +1 aiuti a mitigare il nitpicking!
walkytalky,

@walkytalky Grazie per le correzioni, ho apportato alcune correzioni.
Sharpie,

1
Qualsiasi variabile è un segnaposto per un valore. È possibile assegnare questo o quel valore a una variabile (a volte l'insieme di valori che è possibile assegnare è vincolato da un insieme, chiamato tipo ). Le variabili che mantengono un singolo valore invariato sono note come "costanti". Potresti voler dire che la variabile casuale mantiene un valore noto mentre il valore della variabile casuale è sconosciuto? Ciò è in contraddizione con le altre risposte, che affermano che la variabile casuale non è affatto una variabile - è una funzione che (deterministicamente) associa lo stato sconosciuto a qualcos'altro. Non è casuale e non è una variabile, dicono.
Val

6

Mi è stata raccontata questa storia:

Una variabile casuale può essere paragonata al sacro impero romano: il Sacro Romano Impero non era sacro, non era romano e non era un impero.

Allo stesso modo, una variabile casuale non è né casuale né una variabile. È solo una funzione. (la storia è stata raccontata qui: fonte ).

Questo è almeno un modo silenzioso di spiegare, che potrebbe aiutare le persone a ricordare!


3

Da Wikipedia :

In matematica (in particolare teoria della probabilità e statistica), una variabile casuale (o variabile stocastica) è (in generale) una funzione misurabile che mappa uno spazio di probabilità in uno spazio misurabile. Le variabili casuali che mappano tutti i possibili risultati di un evento nei numeri reali sono frequentemente studiate nelle statistiche elementari e utilizzate nelle scienze per fare previsioni basate su dati ottenuti da esperimenti scientifici. Oltre alle applicazioni scientifiche, sono state sviluppate variabili casuali per l'analisi di giochi d'azzardo ed eventi stocastici. L'utilità di variabili casuali deriva dalla loro capacità di acquisire solo le proprietà matematiche necessarie per rispondere a domande probabilistiche.

Da cnx.org :

Una variabile casuale è una funzione che assegna valori numerici univoci a tutti i possibili risultati di un esperimento casuale in condizioni fisse. Una variabile casuale non è una variabile ma piuttosto una funzione che mappa gli eventi ai numeri.


4
Nessuna delle definizioni di cnx.org è corretta: la prima a causa del suo uso vago - e forse fuorviante - di "condizioni uniche" e "fisse" e la seconda perché è semplicemente sbagliata; un camper è definito sui risultati (elementi dello spazio campione), non sugli eventi (serie misurabili di risultati).
whuber

P=κλeλtκ=0P(t)dtED(t)=λeλtED(t)

1
f(x)

3

Una variabile casuale, solitamente indicata con X, è una variabile in cui il risultato è incerto. L'osservazione di un risultato particolare di questa variabile si chiama realizzazione. Più concretamente, è una funzione che mappa uno spazio di probabilità in uno spazio misurabile, generalmente chiamato spazio di stato. Le variabili casuali sono discrete (possono assumere un numero di valori distinti) o continue (possono assumere un numero infinito di valori).

Considera la variabile casuale X che è il totale ottenuto quando tira due dadi. Può prendere uno qualsiasi dei valori 2-12 (con uguale probabilità dati dadi equi) e il risultato è incerto fino al lancio dei dadi.


5
Solo un pensiero, ma sembra che stai dicendo che la probabilità di ottenere un 12 (1/36) è la stessa di un 7 (1/6).
jefflovejapan,

0

Nei miei studi universitari non matematici, ci è stato detto che la variabile casuale è una mappa dai valori che la variabile può portare alle probabilità. Ciò ha permesso di disegnare le distribuzioni di probabilità

http://mathbits.com/MathBits/TISection/Statistics2/normaldistribution.htm

Di recente, ho capito quanto sia diverso da ciò che i matematici hanno in mente. Si scopre che per variabile casuale si intende una semplice funzione X: Ω → R, che accetta un elemento dello spazio campione Ω ( aka risultato, ticket o individuo , come spiegato sopra) e lo traduce in un numero reale R nell'intervallo ( -∞, ∞). Cioè, è stato giustamente notato sopra che non è casuale e nessuna variabile. La casualità viene solitamente con la misura di probabilità P, come parte dello spazio di misura (Ω, P). P mappa i campioni su R, in modo simile alla variabile casuale ma questo intervallo di tempo è limitato a [0,1] e possiamo dire che la variabile casuale traduce (Ω, P) in (R, P), quindi una variabile casuale è dotata di probabilità misura P: R -> [0,1] in modo da poter dire per ogni x in R qual è la probabilità che si verifichi.

Ω

H(Ω)=P(Ωi)ln(Ωi)

integrale non ha bisogno di alcun valore reale di variabile casuale.


XAσA
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.