Bene, se hai un campione da una distribuzione di pareto con i parametri e (dove è il parametro limite inferiore e è il parametro forma) la probabilità logaritmica di quello il campione è: m > 0 α > 0 m αX1, . . . , Xnm > 0α > 0mα
n log( α ) + n α log( m ) - ( α + 1 ) ∑i = 1nlog( Xio)
questo è un aumento monotonico in , quindi il massimizzatore è il valore più grande che è coerente con i dati osservati. Poiché il parametro definisce il limite inferiore del supporto per la distribuzione di Pareto, l'ottimale èmmm
m^= minioXio
che non dipende da . Quindi, usando i normali trucchi di calcolo, l'MLE per deve soddisfareααα
nα+ n registro( m^) - ∑i = 1nlog( Xio) = 0
qualche semplice algebra ci dice che il MLE di èα
α^= nΣni = 1log( Xio/ m^)
In molti sensi importanti (ad es. Efficienza asintotica ottimale in quanto raggiunge il limite inferiore di Cramer-Rao), questo è il modo migliore per adattare i dati a una distribuzione di Pareto. Il codice R sottostante calcola la SMV per un dato insieme di dati, X
.
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
Modifica: in base al commento di @cardinal e I di seguito, possiamo anche notare che è il reciproco della media di esempio di , che accade a avere una distribuzione esponenziale. Pertanto, se abbiamo accesso a software in grado di adattarsi a una distribuzione esponenziale (che è più probabile, dal momento che sembra insorgere in molti problemi statistici), è possibile realizzare una distribuzione di Pareto trasformando il set di dati in questo modo e adattandolo a una distribuzione esponenziale sulla scala trasformata. log(Xi/ m )α^log( Xio/ m^)