Si dispone di una versione discretizzata della distribuzione del registro negativo, ovvero la distribuzione il cui supporto è e il cui pdf è .f ( t ) = - registro t[ 0 , 1 ]f( t ) = - logt
Per vedere questo, ridefinirò la tua variabile casuale per prendere valori nell'insieme invece di e chiamare il conseguente distribuzione di . Quindi, la mia richiesta è quella{ 0 , 1 , 2 , … , N } T{ 0 , 1 / N, 2 / N, ... , 1 }{ 0 , 1 , 2 , … , N}T
Pr ( T= tN) →- 1Nlog( tN)
come mentre è mantenuto (approssimativamente) costante. N, t → ∞tN
Innanzitutto, un piccolo esperimento di simulazione che dimostra questa convergenza. Ecco una piccola implementazione di un campionatore dalla tua distribuzione:
t_sample <- function(N, size) {
bounds <- sample(1:N, size=size, replace=TRUE)
samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
samples / N
}
Ecco un istogramma di un grande campione prelevato dalla tua distribuzione:
ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)
ed ecco il pdf logaritmico sovrapposto:
linsp <- 1:100 / 100
lines(linsp, -log(linsp))
Per capire perché si verifica questa convergenza, inizia con la tua espressione
Pr ( T= tN) = 1NΣj = tN1j
e moltiplicare e dividere perN
Pr ( T= tN) = 1NΣj = tNNj1N
La somma ora è una somma di Riemann per la funzione , integrata da a . Cioè, per grande ,g( x ) = 1XtN1N
Pr ( T= tN) ≈ 1N∫1tN1Xdx = - 1Nlog( tN)
che è l'espressione a cui volevo arrivare.