Esempi di vita reale di distribuzioni comuni


28

Sono uno studente laureato che sviluppa un interesse per la statistica. Mi piace soprattutto il materiale, ma a volte faccio fatica a pensare alle applicazioni nella vita reale. In particolare, la mia domanda riguarda le distribuzioni statistiche comunemente usate (normale - beta-gamma ecc.). Immagino che in alcuni casi ottengo le proprietà particolari che rendono la distribuzione abbastanza piacevole, ad esempio la proprietà senza memoria dell'esponenziale. Ma per molti altri casi, non ho un'intuizione sull'importanza e sulle aree di applicazione delle distribuzioni comuni che vediamo nei libri di testo.

Probabilmente ci sono molte buone fonti che rispondono alle mie preoccupazioni, sarei felice se tu potessi condividerle. Sarei molto più motivato nel materiale se potessi associarlo ad esempi di vita reale.


8
Quattordici tipi di applicazioni che coprono una vasta gamma di distribuzioni sono descritti sotto "applicazioni" nella pagina di aiuto per la EstimatedDistribution funzione di Mathematica .
whuber

Risposte:


23

Wikipedia ha una pagina che elenca molte distribuzioni di probabilità con collegamenti a maggiori dettagli su ciascuna distribuzione. È possibile consultare l'elenco e seguire i collegamenti per avere un'idea migliore dei tipi di applicazioni per cui vengono comunemente utilizzate le diverse distribuzioni.

Ricorda solo che queste distribuzioni sono usate per modellare la realtà e come ha detto Box: "tutti i modelli sono sbagliati, alcuni sono utili".

Ecco alcune delle distribuzioni comuni e alcuni dei motivi per cui sono utili:

Normale: è utile per esaminare le medie e altre combinazioni lineari (ad es. Coefficienti di regressione) a causa del CLT. In relazione a ciò, se si sa che qualcosa si presenta a causa degli effetti additivi di molte diverse cause minori, allora la normale può essere una distribuzione ragionevole: ad esempio, molte misure biologiche sono il risultato di più geni e molteplici fattori ambientali e quindi sono spesso approssimativamente normali .

Gamma: giusta inclinazione e utile per le cose con un minimo naturale a 0. Comunemente usato per i tempi trascorsi e alcune variabili finanziarie.

Esponenziale: caso speciale della Gamma. È senza memoria e si ridimensiona facilmente.

χ2

Beta: definito tra 0 e 1 (ma potrebbe essere trasformato tra altri valori), utile per proporzioni o altre quantità che devono essere comprese tra 0 e 1.

Binomiale: quanti "successi" su un determinato numero di prove indipendenti con la stessa probabilità di "successo".

Poisson: comune per i conteggi. Belle proprietà che se il numero di eventi in un periodo di tempo o area segue un Poisson, il numero in due volte il tempo o l'area segue ancora il Poisson (con il doppio della media): questo funziona per aggiungere Poisson o ridimensionare con valori diversi da 2.

Si noti che se gli eventi si verificano nel tempo e il tempo tra le occorrenze segue un esponenziale, il numero che si verifica in un periodo di tempo segue un Poisson.

Binomio negativo: conta con un minimo di 0 (o altro valore a seconda della versione) e nessun limite superiore. Concettualmente è il numero di "fallimenti" prima di k "successi". Il binomio negativo è anche una miscela di variabili di Poisson i cui mezzi provengono da una distribuzione gamma.

Geometrico: caso speciale per binomio negativo dove è il numero di "guasti" prima del primo "successo". Se si tronca (arrotondando per difetto) una variabile esponenziale per renderla discreta, il risultato è geometrico.


3
Bene grazie per la tua risposta. Tuttavia, Wikipedia fornisce una descrizione più generale che mi piacerebbe. Fondamentalmente, la mia domanda è: perché alcune distribuzioni sono belle? Per dare una possibile risposta in caso di distribuzione normale, può essere correlato al teorema limitato centrale - che dice che se campionate una quantità infinita di osservazioni potete effettivamente vedere negli asintotici che una statistica sufficiente di tali osservazioni, data l'indipendenza, ha una distribuzione normale . Sto cercando altri esempi come quello ...
Roark,

Non esattamente una vera distribuzione, ma per quanto riguarda bimodale? Non riesco a pensare a nessun esempio di vita reale comunemente visto dopo aver scoperto che molte delle differenze di genere nell'uomo non sono bimodali.
soffitto gatto

Aggiungi multinomiale

3

La teoria asintotica conduce alla distribuzione normale, ai tipi di valore estremo, alle leggi stabili e al Poisson. L'esponenziale e il Weibull tendono a presentarsi come tempo parametrico per le distribuzioni degli eventi. Nel caso del Weibull è un tipo di valore estremo per il minimo di un campione. Relativamente ai modelli parametrici per le osservazioni normalmente distribuite, le distribuzioni chi quadrato, te F si verificano nelle prove di ipotesi e nella stima dell'intervallo di confidenza. Il chi quadrato si presenta anche nell'analisi della tabella di contingenza e nella bontà dei test di adattamento. Per studiare la potenza dei test abbiamo le distribuzioni t e F non centrali. La distribuzione ipergeometrica sorge nel test esatto di Fisher per le tabelle di contingenza. La distribuzione binomiale è importante quando si fanno esperimenti per stimare le proporzioni. Il binomio negativo è un'importante distribuzione per modellare la sovradispersione in un processo puntuale. Questo dovrebbe darti un buon inizio su distorsioni parametriche pratiche. Per variabili casuali non negative su (0, ∞) la distribuzione Gamma è flessibile per fornire una varietà di forme e viene comunemente utilizzato anche il log normale. Su [0,1] la famiglia beta fornisce distirbuzioni simmetriche tra cui l'uniforme e le distribuzioni inclinate a sinistra o inclinate a destra.

Vorrei anche menzionare che se vuoi conoscere tutti i dettagli grintosi delle distribuzioni nelle statistiche ci sono le classiche serie di libri di Johnson e Kotz che includono distribuzioni discrete, distribuzioni univariate continue e distribuzioni multivariate continue e anche il volume 1 della teoria avanzata di statistiche di Kendall e Stuart.


Grazie mille per la risposta, questo è estremamente utile. Grazie ancora, mi ha davvero aiutato.
Roark,

2

Acquista e leggi almeno i primi 6 capitoli (prime 218 pagine) di William J. Feller "Un'introduzione alla teoria della probabilità e alle sue applicazioni, Vol. 2" http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb . Almeno leggi tutti i Problemi per soluzione e preferibilmente prova a risolverne il maggior numero possibile. Non è necessario aver letto Vol 1, che a mio avviso non è particolarmente meritorio.

Nonostante l'autore sia morto 45 anni e mezzo fa, prima ancora che il libro fosse finito, questo è semplicemente il libro più bello che ci sia, tranne nessuno, per sviluppare un'intuizione nella probabilità e nei processi stocastici, e comprendere e sviluppare un feeling per varie distribuzioni , in che modo si collegano ai fenomeni del mondo reale e ai vari fenomeni stocastici che possono e si verificano. E con la solida base che costruirai da essa, sarai ben servito nelle statistiche.

Se riesci a farlo attraverso i capitoli successivi, il che diventa un po 'più difficile, sarai anni luce avanti di quasi tutti. In poche parole, se conosci Feller Vol 2, conosci la probabilità (e i processi stocastici); nel senso che, qualunque cosa tu non sappia, come i nuovi sviluppi, sarai in grado di raccogliere e padroneggiare rapidamente costruendo su quelle solide basi.

Quasi tutto ciò che è stato precedentemente menzionato in questo thread è in Feller Vol 2 (non tutto il materiale in Kendall Advanced Theory of Statistics, ma leggere quel libro sarà un gioco da ragazzi dopo Feller Vol 2), e altro ancora, molto di più, tutto in un modo che dovrebbe sviluppare il tuo pensiero e intuizione stocastici. Johnson and Kotz è buono per le minuzie su varie distribuzioni di probabilità, Feller Vol 2 è utile per imparare a pensare in modo probabilistico e sapere cosa estrarre da Johnson e Kotz e come usarlo.


2

Solo per aggiungere alle altre risposte eccellenti.

npλ=nprimane costante, limitato da zero e infinito. Questo ci dice che è utile ogni volta che abbiamo un gran numero di eventi singolarmente molto improbabili. Alcuni buoni esempi sono: incidenti, come il numero di incidenti stradali a New York in un giorno, dal momento che ogni volta che due macchine passano / si incontrano c'è una probabilità molto bassa di incidente e il numero di tali opportunità è davvero astronomico! Ora tu stesso puoi pensare ad altri esempi, come il numero totale di incidenti aerei nel mondo in un anno. L'esempio classico in cui il numero di morti per amazzoni nella cavalleria preussiana!

np(1p)p1pnpλpp


0

Ricerche pubblicate di recentesuggerisce che le prestazioni umane NON sono normalmente distribuite, contrariamente al pensiero comune. Sono stati analizzati i dati provenienti da quattro settori: (1) accademici in 50 discipline, in base alla frequenza di pubblicazione nelle più importanti riviste specifiche per disciplina. (2) Animatori, come attori, musicisti e scrittori, e il numero di prestigiosi premi, nomination o riconoscimenti ricevuti. (3) Politici in 10 nazioni e risultati delle elezioni / rielezioni. (4) Atleti collegiali e professionisti che esaminano le misure più personalizzate disponibili, come il numero di corse a casa, i ricevimenti negli sport di squadra e le vittorie totali negli sport individuali. L'autore scrive: "Abbiamo visto una distribuzione chiara e coerente della legge del potere svolgersi in ogni studio, indipendentemente da quanto strettamente o ampiamente abbiamo analizzato i dati ..."


4
Chi ha suggerito che le prestazioni umane sono normalmente distribuite ?! Il principio 80-20 fu suggerito da Pareto (1906!).
abaumann
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.