Cosa si intende per distribuzione categorica?


11

Questo tipo separato di distribuzione (EX: binomiale, bernoulli, multinomiale) o qualsiasi distribuzione può essere rappresentato in questo modo? Qualcuno può elaborare con un semplice esempio

Risposte:


11

La distribuzione categorica è la generalizzazione della distribuzione di Bernoulli a un numero fisso 2k di esiti.

Allo stesso modo, è il caso speciale della distribuzione multinomiale in cui il numero di "scelte" n è fissato a uno.

Pertanto, ha pdf:

i=1kpixi(where 0pi and ipi=1)
xi{0,1}
ni=1kxi=1.

In breve, Bernoulli ha , il binomio ha , il multinomiale ha e categoriale ha .k = 2 , n 1 k 2 , n 1 k 2 , n = 1K=2,n=1K=2,n1K2,n1K2,n=1


è necessario, xi = 0,1. Non può essere più di questo.
subha,

@subha: La mia comprensione della distribuzione categorica è così. Per multinomiale e binomiale, ovviamente può essere.
Neil G,

5

Le variabili categoriali hanno insiemi finiti di valori discreti. Gli esempi includono sesso (maschio / femmina), paese, pianeta, ecc. Contrastalo con variabili continue, che possono assumere un numero infinito di valori diversi. Gli esempi includono peso, longitudine, distanza, ecc.

Si noti che a volte informazioni simili possono essere espresse in modo categorico e continuo; ad esempio, planet = earthpotrebbe essere espresso come distance to sun = 1 astronomical unit ≈ 150 million kilometers. Tuttavia, non c'è davvero alcun modo per esprimere 200 milioni di chilometri dal sole in termini di pianeti, perché non c'è nessun pianeta lì (Marte è 228 milioni di km dal sole). Lo stesso vale per 201 milioni di km, 202, ecc. Tutto ciò che si può dire su queste distanze in termini di pianeti è planet = none; non si potrebbe dire planet = 4/3×eartho .88×Mars, perché non esiste un modo significativo per moltiplicare un pianeta o qualsiasi altra variabile categoriale. In termini di pianeti, queste distanze sarebbero indistinguibili, ma ovviamente hanno senso come distinte distanze dal sole quando espresse come tali - come una variabile continua.

Si possono anche esprimere variabili continue con precisione arbitraria (ad esempio, un'unità astronomica è 149.597.871 km, non esattamente 150 milioni di km). Al contrario, non c'è modo di esprimersi in modo planet = earthpiù preciso; La Terra è esattamente terra, né più né meno. Inoltre, non avrebbe senso dire che qualsiasi altro pianeta è "più" o "meno" della Terra se planetè una variabile nominale. Potrebbe essere codificato come variabile ordinata (ordinale) - i pianeti sono ordinati in termini di distanza dal sole, volume, numero di lune, ecc. Questi numeri sono tutti continui nei loro termini (o almeno conteggi, che sono discreti ma non categorico), ma non in termini di pianeti. Ad esempio, se i pianeti sono in ordine di distanza dal sole o dal numero di lune, mars > earth > venus. Se i pianeti sono ordinati per volume,earth > venus > mars. Non è necessario ordinare variabili categoriche e forse alcune non possono essere ordinate, ma l'aggiunta di ordine non le rende meno categoriche.

Come dice Wikipedia, le distribuzioni categoriali sono generalizzazioni della distribuzione di Bernoulli a più di due possibili valori (la distribuzione di Bernoulli è rigorosamente binaria). Anche la distribuzione di Bernoulli è un caso speciale della distribuzione binomiale, ma non definirei la distribuzione binomiale categorica (è discreta, ma una variabile di conteggio, quindi vengono definite le distanze tra i valori). Le distribuzioni multinomiali possono essere confuse con le distribuzioni categoriche, ma Wikipedia mette in guardia contro questo .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.