CDF empirico vs CDF


21

Sto imparando a conoscere la funzione di distribuzione cumulativa empirica. Ma ancora non capisco

  1. Perché si chiama "empirico"?

  2. C'è qualche differenza tra Empirical CDF e CDF?



Esiste una spiegazione semplice, diretta ed elegante in termini di biglietti in un modello a scatola : il CDF descrive ciò che è nella scatola originale. L'ECDF è ciò che ottieni quando metti il ​​tuo campione (che è un insieme di biglietti estratti dalla scatola originale: i cosiddetti dati "empirici") in una scatola vuota.
whuber

Una cosa da tenere presente è che la tua distribuzione empirica è generalmente limitata dal modo in cui è costruita, mentre il CDF potrebbe non esserlo. Ad esempio, se si costruisce un CDF empirico dalle osservazioni della variabile di Poisson, l'ECDF ottenuto sarà limitato dalla massima frequenza osservata, mentre il vero CDF non è limitato.
Aksakal,

Risposte:


27

Lascia che sia una variabile casuale.X

  • La funzione di distribuzione cumulativa fornisce .F(x)P(Xx)
  • Una funzione di distribuzione cumulativa empirica fornisce base alle osservazioni nel campione.G(X)P(XX)

La distinzione è quale misura di probabilità viene utilizzata. Per il CDF empirico, si utilizza la misura di probabilità definita dai conteggi di frequenza in un campione empirico.

Esempio semplice (lancio della moneta):

Sia una variabile casuale che indica il risultato di un singolo lancio di una moneta in cui indica teste e indica code.XX=1X=0

Il CDF per una moneta giusta è dato da:

F(X)={0per X<012per 0X<11per 1X

Se avessi girato 2 teste e 1 coda, il CDF empirico sarebbe:

sol(X)={0per X<023per 0X<11per 1X

Il CDF empirico rifletterebbe che nel tuo campione, dei tuoi lanci erano teste.2/3

Un altro esempio ( è CDF per la distribuzione normale):F

Sia una variabile casuale normalmente distribuita con media e deviazione standard .X01

Il CDF è dato da:

F(X)=-X12πe-X22

Supponiamo che tu abbia avuto 3 disegni IID e ottenuto i valori . Il CDF empirico sarebbe: X1<X2<X3

sol(y)={0per y<X113per X1y<X223per X2y<X31per X3y

Con sufficienti estrazioni IID (e determinate condizioni di regolarità sono soddisfatte), la CDF empirica converrebbe sul CDF sottostante della popolazione.


12

C'è qualche differenza tra Empirical CDF e CDF?

Sì, sono diversi. Un cdf empirico è un vero cdf, ma i cdf empirici saranno sempre discreti anche se non attinti da una distribuzione discreta, mentre il cdf di una distribuzione può essere altro oltre al discreto.

Se trattate un campione come se fosse una popolazione di valori, ognuno ugualmente probabile (cioè ponete la probabilità 1 / n su ciascuna osservazione), il cdf di quella distribuzione sarebbe l'ECDF dei dati.

Perché si chiama "Empirical"?

È una stima della popolazione cdf basata sul campione; in particolare se trattate le proporzioni del campione ad ogni valore di dati distinto e lo trattate come se fosse una probabilità nella popolazione, ottenete l'ECDF.

Empirical ha un significato simile a "dall'osservazione piuttosto che dalla teoria", ed è esattamente ciò che significa in questo caso ... usando le osservazioni per determinare la funzione di distribuzione.


10

Il CDF empirico è costruito da un set di dati reale (nella trama sotto, ho usato 100 campioni da una distribuzione normale standard). Il CDF è un costrutto teorico - è quello che vedresti se potessi prendere infiniti campioni.

Il CDF empirico di solito si avvicina abbastanza bene al CDF, specialmente per campioni di grandi dimensioni (in realtà, ci sono teoremi su quanto velocemente converge al CDF all'aumentare della dimensione del campione).

CDF empirico vs CDF


10

Empirical è qualcosa che costruisci da dati e osservazioni. Ad esempio, supponiamo che tu voglia conoscere la distribuzione dell'altezza delle persone in un paese. Si inizia misurando le persone e si ottiene un istogramma che può essere approssimato a una distribuzione. Quindi si calcola il CDF empirico.

Se stai usando una distribuzione statistica (una formula deterministica che fornisce esattamente lo stesso risultato con gli stessi parametri) puoi anche calcolare il suo CDF.

N(μ=1.75 m,σ=0.1 m)


È stata impiegata una misurazione della fiducia che esprime la probabilità che CDF e Emperical CDF descrivano la stessa popolazione nel limite di tutti i campionamenti sperimentali nel mondo? Ciò sembrerebbe avere applicazione al sondaggio elettorale, per esempio. (anche se forse no, poiché l'output non è strettamente descrivibile come una funzione ...)
BenPen

3

Secondo Dictionary.com , le definizioni di "empirico" includono:

derivato o guidato da esperienza o esperimento.

Quindi, il CDF empirico è il CDF che ottieni dai tuoi dati. Ciò contrasta con il CDF teorico (spesso chiamato semplicemente "CDF"), che si ottiene da un modello statistico o probabilistico come la distribuzione normale.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.