Questa distribuzione discreta ha un nome?


21

Questa distribuzione discreta ha un nome? Perio1 ...N

f(io)=1NΣj=ioN1j

Mi sono imbattuto in questa distribuzione da quanto segue: ho un elenco di elementi classificati in base a una funzione di utilità. Voglio selezionare casualmente uno degli elementi, orientando verso l'inizio dell'elenco. Quindi, prima scelgo un indice tra 1 e uniformemente. Seleziono quindi un elemento tra gli indici 1 e . Credo che questo processo porti alla distribuzione di cui sopra.j N jNjNj


2
Questa non è una distribuzione: non è normalizzata.
whuber

@whuber L'ho pensato all'inizio (e commentato prima di rendermi conto di aver frainteso e rimosso il commento), ma alla fine ho capito male la definizione. A meno che non abbia un ulteriore equivoco, si tratta di una funzione di massa di probabilità normalizzata.
Glen_b

4
È normalizzato. 1/1 apparirà nella somma esattamente una volta (sarà in f (1)). 1/2 apparirà esattamente due volte (sarà in f (1) ef (2)). ecc. Quindi la somma di tutte queste somme sarà N e la costante normalizzante viene mostrata come 1 / N. controlla.
rcorty,

1
Più precisamente, però, non so come si chiama questa distro. Inoltre non so come il processo che hai descritto porti a questa distro. Un pensiero che ho avuto è che suona come una versione discreta di un processo rivoluzionario, che è molto googlable.
rcorty,

@Glen_b Grazie. Lo stavo leggendo sul mio telefono, il che non rendeva abbastanza chiaramente. f
whuber

Risposte:


30

Si dispone di una versione discretizzata della distribuzione del registro negativo, ovvero la distribuzione il cui supporto è e il cui pdf è .f ( t ) = - registro t[0,1]f(t)=-logt

Per vedere questo, ridefinirò la tua variabile casuale per prendere valori nell'insieme invece di e chiamare il conseguente distribuzione di . Quindi, la mia richiesta è quella{ 0 , 1 , 2 , , N } T{0,1/N,2/N,...,1}{0,1,2,...,N}T

Pr(T=tN)-1Nlog(tN)

come mentre è mantenuto (approssimativamente) costante. N,ttN

Innanzitutto, un piccolo esperimento di simulazione che dimostra questa convergenza. Ecco una piccola implementazione di un campionatore dalla tua distribuzione:

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

Ecco un istogramma di un grande campione prelevato dalla tua distribuzione:

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

inserisci qui la descrizione dell'immagine

ed ecco il pdf logaritmico sovrapposto:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

inserisci qui la descrizione dell'immagine

Per capire perché si verifica questa convergenza, inizia con la tua espressione

Pr(T=tN)=1NΣj=tN1j

e moltiplicare e dividere perN

Pr(T=tN)=1NΣj=tNNj1N

La somma ora è una somma di Riemann per la funzione , integrata da a . Cioè, per grande ,g(X)=1XtN1N

Pr(T=tN)1NtN11XdX=-1Nlog(tN)

che è l'espressione a cui volevo arrivare.


Prego. Questa è stata un'ottima domanda e mi sono divertito molto a risolverlo.
Matthew Drury,

6

Questo sembra essere correlato alla distribuzione Whitworth. (Non credo che sia la distribuzione di Whitworth, poiché se ricordo bene, è la distribuzione di un insieme di valori ordinati, ma sembra essere collegato ad esso e si basa sullo stesso schema di sommatoria.)

C'è qualche discussione sul Whitworth (e numerosi riferimenti) in

Anthony Lawrance e Robert Marks, (2008)
"Distribuzioni di dimensioni aziendali in un settore con risorse limitate",
Applied Economics , vol. 40, numero 12, pagine 1595-1607

(Sembra esserci una versione di lavoro qui )

Vedi anche

Nancy L Geller, (1979)
Un test di significato per la distribuzione di Whitworth,
Journal of American Society for Information Science , Vol.30 (4), pp.229-231


2
Per rendere questa risposta autonoma, potresti fornire una definizione della distribuzione di Whitworth e forse fornire qualche parola di spiegazione riguardo alla connessione che vedi?
whuber

@whuber Sì, dovrebbe essere un commento così com'è. Modificherò alcuni dettagli ma finirà molto più a lungo.
Glen_b -Restate Monica,

Solo un qualche tipo di definizione andrebbe bene.
whuber

Grazie, questo è stato compreso, ma comunque sarà il risultato.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.