Sto cercando di trovare la distribuzione caratteristica più appropriata di dati di misure ripetute di un certo tipo.
In sostanza, nel mio ramo della geologia, usiamo spesso la datazione radiometrica di minerali da campioni (pezzi di roccia) per scoprire quanto tempo fa è accaduto un evento (la roccia si è raffreddata al di sotto di una soglia di temperatura). In genere, verranno eseguite diverse (3-10) misurazioni da ciascun campione. Quindi, vengono prese la media e la deviazione standard . Questa è geologia, quindi le età di raffreddamento dei campioni possono scalare da a anni, a seconda della situazione.σ 10 5 10 9
Tuttavia, ho motivo di credere che le misurazioni non siano gaussiane: i "valori anomali", dichiarati arbitrariamente, o attraverso alcuni criteri come il criterio di Peirce [Ross, 2003] o il test Q di Dixon [Dean e Dixon, 1951] , sono abbastanza comune (diciamo, 1 su 30) e questi sono quasi sempre più vecchi, indicando che queste misurazioni sono tipicamente distorte a destra. Ci sono ragioni ben note per questo a che fare con le impurità mineralogiche.
Pertanto, se riesco a trovare una migliore distribuzione, che incorpora code e inclinazione elevate, penso che possiamo costruire parametri di posizione e scala più significativi e non dover rinunciare agli outlier così rapidamente. Vale a dire se si può dimostrare che questi tipi di misurazioni sono lognormali, o log-Laplaciani, o qualsiasi altra cosa, allora si possono usare misure più appropriate di massima probabilità rispetto a e , che sono non robuste e forse distorte nel caso di dati sistematicamente distorti.σ
Mi chiedo quale sia il modo migliore per farlo. Finora, ho un database con circa 600 campioni e 2-10 (circa) replicano le misurazioni per campione. Ho provato a normalizzare i campioni dividendo ciascuno per la media o la mediana e quindi guardando gli istogrammi dei dati normalizzati. Ciò produce risultati ragionevoli e sembra indicare che i dati sono tipicamente log-Laplaciani:
Tuttavia, non sono sicuro se questo è il modo appropriato di procedere, o se ci sono avvertimenti di cui non sono a conoscenza, che potrebbero influenzare i miei risultati in modo che sembrino così. Qualcuno ha esperienza con questo genere di cose e conosce le migliori pratiche?