Qualcuno può aiutare a spiegare la differenza tra indipendente e casuale?


21

In statistica, indipendente e casuale descrivono le stesse caratteristiche? Qual è la differenza tra loro? Spesso ci imbattiamo nella descrizione come "due variabili casuali indipendenti" o "campionamento casuale". Mi chiedo quale sia la differenza esatta tra loro. Qualcuno può spiegare questo e dare alcuni esempi? per esempio processo non indipendente ma casuale?


Ecco due concetti distinti (a un livello non molto profondo) uniti. "Indipendente" nel senso indipendente generato osservazioni e "variabili indipendenti" hanno scritto le loro distribuzioni.
ttnphns,

3
Questa è una domanda strana, perché se dovessi consultare le definizioni formali di "variabile casuale" e "indipendente" - che è ciò che "nelle statistiche" sembrerebbe suggerire - scopriresti che hanno poco in comune.
whuber

@ttnphns, Sì, immagino di essere più confuso riguardo al termine "osservazioni generate in modo indipendente" con "generato casualmente". Nel campionamento, spesso sentiamo campionamenti casuali (semplici), che mi fanno sentire campioni indipendenti. Immagino che se vogliamo davvero combinare entrambe le caratteristiche nella descrizione di un metodo di campionamento, dovrebbe essere: la selezione delle osservazioni non dipende l'una dall'altra (= indipendentemente) e la probabilità di selezione di un'osservazione è nota (= in modo casuale)?
tiantianchen,

1
Se controlliamo la definizione di indipendenza dal wiki: "Nella teoria della probabilità, due eventi sono indipendenti, statisticamente indipendenti o stocasticamente indipendenti se il verificarsi di uno non influisce sulla probabilità dell'altro.", La dipendenza di due osservazioni dovrebbe essere basata su come sono generati / selezionati, piuttosto che come appaiono nei dati. Quindi le due osservazioni identiche nel caso sopra menzionato dovrebbero essere ancora indipendenti.
tiantianchen,

2
Si prega di non confondere la spiegazione euristica all'inizio di qualsiasi voce di Wikipedia con una definizione. La definizione è riportata sotto l'intestazione "definizione" nello stesso articolo . È quello offerto nella risposta di Tim qui.
whuber

Risposte:


35

Proverò a spiegarlo in termini non tecnici: una variabile casuale descrive un risultato di un esperimento; non puoi sapere in anticipo quale sarà il risultato esatto ma hai alcune informazioni: sai quali sono i risultati possibili e conosci, per ogni risultato, la sua probabilità.

Ad esempio, se lanci una moneta giusta non sai in anticipo se otterrai testa o coda, ma sai che questi sono i possibili risultati e sai che ognuno ha il 50% di possibilità di accadimento.

Per spiegare l'indipendenza devi lanciare due monete giuste. Dopo aver lanciato la prima moneta, sai che per il secondo lancio le probabilità di testa sono ancora del 50% e anche per la coda. Se il primo lancio non ha alcuna influenza sulle probabilità del secondo, entrambi i lanci sono indipendenti. Se il primo lancio ha un'influenza sulle probabilità del secondo lancio, allora sono dipendenti.

Un esempio di lanci dipendenti è quando si incollano insieme le due monete.


3
Un'altra coppia di variabili dipendenti sarebbe "se hai la testa" e "se hai la coda". Entrambi sono casuali ma non indipendenti l'uno dall'altro.
user253751

3
@immibis Oppure tira un dado equo, annota il valore. quindi ruotalo ancora una volta e moltiplica il valore per il valore annotato. Questo valore è casuale, ma dipende dal primo lancio.
Crowley,

8

Casuale si riferisce alla variabile casuale e indipendente si riferisce all'indipendenza probabilistica. Per indipendenza intendiamo che osservare una variabile non ci dice nulla sull'altra, o in termini più formali, se e Y sono due variabili casuali, quindi diciamo che sono indipendenti seXY

pX,Y(x,y)=pX(x)pY(y)

inoltre

E(XY)=E(X)E(Y)

e la loro covarianza è zero. La variabile casuale dipende da X se può essere scritta in funzione di XYXX

Y=f(X)

Quindi in questo caso è casuale e dipende da XYX .

Definire il processo "non indipendente" è piuttosto fuorviante, indipendentemente da cosa? Immagino che intendessi dire che ci sono alcune variabili casuali indipendenti e identicamente distribuite (controlla qui o qui ) che provengono da un processo. Indipendentemente da noi vorremmo dire qui che sono indipendenti l'uno dall'altro. Esistono processi che producono variabili casuali dipendenti, ad esX1,,Xk

Xi=Xi1+ε

dove è un rumore casuale. Ovviamente in tal caso X i dipende da X i - 1 , ma è anche casuale.εXiXi1


Cosa fa se X è una variabile casuale? Penso che stai confondendo camper e eventi: due camper X e Y sono indipendenti se glieventi P ( X r ) e P ( Y s ) sono indipendenti per tutti i r, sP(X) P(Xr)P(Ys)
Matthew Towers

Quindi ogni due variabili casuali continue sono indipendenti.
Matthew Towers,

@m_t_ Non credo davvero che discutere della notazione porti da nessuna parte (vedi ad es. en.wikipedia.org/wiki/… )
Tim


2
@tiantianchen viceversa: se hai le variabili casuali, puoi costruire la funzione di probabilità moltiplicando i singoli pdf perché sono indipendenti.
Tim

1

Le variabili sono utilizzate in tutti i campi della matematica. Le definizioni di indipendenza e casualità di una variabile vengono applicate unilateralmente a tutte le forme di matematica, non solo alla statistica.

Ad esempio, gli assi X e Y nella geometria euclidea bidimensionale rappresentano variabili indipendenti, tuttavia i loro valori non sono (di solito) assegnati in modo casuale.

Due variabili fornite possono essere casuali, o indipendenti (l'una dall'altra), o entrambe, o nessuna delle due. Le statistiche tendono a focalizzarsi sulla casualità (più correttamente, sulla probabilità) e se due variabili siano indipendenti o meno possono avere molte implicazioni per la probabilità che vengano osservati i risultati.

Si tende a vedere queste due proprietà (indipendenza e casualità) descritte insieme quando si studiano le statistiche, perché entrambi sono importanti da sapere e possono influenzare la risposta alla domanda in corso. Tuttavia, queste proprietà non sono sinonimi e in altri campi della matematica non si verificano necessariamente insieme.


Grazie. Puoi spiegarci di più sul fatto che "se due variabili sono indipendenti possono avere molte implicazioni per le probabilità che vengano osservati i risultati".
tiantianchen,

3
Questa è una risposta non statistica che affronta un diverso senso di "indipendente" rispetto a quello usato nella domanda. Confonde anche due sensi di "variabile": uno è quello matematico e l'altro è la definizione statistica di variabile casuale (che sicuramente non è la stessa delle variabili sugli assi geometrici).
whuber

1

La nozione di indipendenza è relativa, mentre puoi essere casuale da solo. Nel tuo esempio, hai "due variabili casuali indipendenti" e non hai bisogno di parlare di diversi "campionamenti casuali".

Supponiamo di lanciare un dado perfetto più volte. Il risultato è a priori casuale. Conoscendo il passato, non è possibile prevedere il numero seguente 4. Supponiamo che io generi una sequenza dall'altro lato del dado: 6 1 , 3 46,5,3,5,46134 . Ottengo . È casuale come il primo. Non puoi immaginare cosa succederà dopo 31,2,4,2,33 . Ma le due sequenze sono completamente dipendenti.

Se uno lancia due dadi in parallelo (senza interazioni tra di loro), le loro rispettive sequenze saranno casuali e indipendenti.


1
Questo può essere un po 'tecnico dato il livello dell'OP, ma per quanto riguarda la tua affermazione "Non puoi essere indipendente (di qualcosa) da solo (come processo, una sequenza)" considera quanto segue: Qualsiasi variabile casuale X, che equivale a una costante c con probabilità uno, è indipendente da "tutto", incluso se stesso. Cioè, per tale X, X è indipendente da X. Puoi facilmente verificarlo secondo la definizione di indipendenza.
Mark L. Stone,

@Mark L. Stone Correggerò questa falsa affermazione. Da solo intendevo "in sé". Nella tua definizione, puoi dire: è indipendente o X e X sono indipendenti? XXX
Laurent Duval,

X è indipendente da se stessa. Cioè, X è indipendente da X.
Mark L. Stone

0

Quando hai una coppia di valori quando il primo viene generato casualmente e il secondo ha una dipendenza dal primo. ad es. altezza e peso di un uomo. C'è una correlazione tra di loro. Ma sono entrambi casuali.


Sebbene questo post utilizzi le parole "casuale" e "dipendente", non le definisce né le distingue chiaramente. In effetti, sembra suggerire che "random = dipendente"!
whuber

0

L'esempio della moneta è un ottimo esempio di una variabile casuale e indipendente, un buon buon modo di pensare a una variabile casuale ma dipendente sarebbe la carta successiva estratta da una scarpa di sette mazzi di carte da gioco, la probabilità di qualsiasi risultato numerico specifico cambia a seconda delle carte precedentemente distribuite, ma fino a quando nella scarpa non rimane un solo valore di carta, il valore della carta che verrà dopo rimarrà casuale.


3
Probabilmente vale la pena sostituire qui la parola "probabilità" con "probabilità", poiché la probabilità ha una definizione tecnica separata nelle statistiche
Silverfish,

1
Una probabilità che dipende da altri eventi (spesso eventi precedenti, ma a volte in base alla conoscenza di eventi futuri o simultanei - in realtà non esiste una direzione temporale verso questo) è chiamata probabilità condizionata . La parola verosimiglianza viene usata per riferirsi a una sorta di "probabilità al contrario" (o, nel caso continuo, una densità di probabilità) - ovvero, si calcola la probabilità di un risultato (ad es. I dati) in base ai parametri del modello ), ma se ci pensiamo al contrario, è la probabilità di quel parametro, dati i tuoi dati .
Silverfish

1
ππ=1/6

-1

David Bohm nella sua opera Causality and Chance in Modern Physics (London: Routledge, 1957/1984) descrive causalità, casualità, casualità e indipendenza:

"In natura nulla rimane costante. Tutto è in uno stato perpetuo di trasformazione, movimento e cambiamento. Tuttavia, scopriamo che nulla emerge semplicemente dal nulla senza avere antecedenti che esistevano prima. Allo stesso modo, nulla scompare mai senza traccia, in la sensazione che non dia origine a nulla di assolutamente esistente in tempi successivi .... tutto proviene da altre cose e dà origine ad altre cose. Questo principio non è ancora una dichiarazione dell'esistenza della causalità in natura. Per arrivare alla causalità, il passo successivo è quindi notare che mentre studiamo i processi che si svolgono in una vasta gamma di condizioni, scopriamo che all'interno di tutta la complessità del cambiamento e della trasformazione ci sono relazioniche rimangono effettivamente costanti. .... A questo punto, tuttavia, incontriamo un nuovo problema. Perché la necessità di una legge causale non è mai assoluta. Quindi, vediamo che si deve concepire la legge della natura come necessaria solo se si astrae dalle contingenze , che rappresentano fattori essenzialmente indipendenti che possono esistere al di fuori del campo di applicazione delle cose che possono essere trattate dalle leggi in esame e che non seguono necessariamente da qualsiasi cosa possa essere specificata nel contesto di queste leggi. Tali contingenze portano al caso . "(Pagg. 1-2)

"La tendenza delle contingenze che si trovano al di fuori di un determinato contesto a fluttuare indipendentemente dagli avvenimenti all'interno di quel contesto si è dimostrata così diffusa che si può enunciarlo come un principio; vale a dire, il principio di casualità. Per casualità intendiamo solo che questa indipendenza conduce alla fluttuazione di queste contingenze in modo molto complicato su una vasta gamma di possibilità, ma in modo tale che le medie statistiche abbiano un comportamento regolare e approssimativamente prevedibile ". (P.22)


3
La tua definizione di "casuale" sembra insolita. Sembra essere intimamente connesso con i concetti di "prevedibilità" e "modello" - ma cosa significano esattamente? Ad esempio, se un esperimento che potenzialmente potrebbe produrre qualsiasi numero tra0 e 1 sono stati costantemente osservati per dare valori di entrambi 1/3 o 4/7, quello sembrerebbe uno "schema" e - nella misura in cui differisce dall'infinito insieme originale di valori possibili - è almeno parzialmente "prevedibile". Dove scrivi "se complotti ..." sembra che tu stia sostenendo che nessuna variabile univariata può essere casuale!
whuber

3
Sembra che tu stia discutendo di processi stocastici (nel tempo) piuttosto che casualità e variabili casuali.
whuber

4
Credo che parte della difficoltà che stiamo incontrando nel comunicare sia che tu sembri pensare "indipendente" nel senso di una variabile indipendente in regressione. Sebbene alcuni elementi della domanda possano suggerire che, le frasi "due variabili casuali indipendenti" e "campionamento casuale" indicano diversamente.
whuber

1
Non riesco nemmeno a capire quale sia la tua comprensione, perché la tua risposta non fornisce definizioni. Devo indovinare cosa stai cercando di dire dagli esempi e dalle descrizioni che dai. Sembrano differire dai sensi di "casuale" e "indipendente" nei modi che ho descritto nei commenti precedenti.
whuber

1
Aggiungerei ai commenti di @whuber che la tua definizione che menziona le variabili casuali che si influenzano a vicenda potrebbe essere fuorviante. "Influenza" è un termine molto forte che implica un qualche tipo di causalità ecc., Mentre la definizione formale di indipendenza non richiede alcuna causalità o influenza, ma si tratta semplicemente di relazioni di probabilità congiunte vs individuali.
Tim
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.