L'articolo chl fornisce alcune informazioni importanti, a dimostrazione del fatto che non è vicino a una regola generale (anche per variabili continue, fluide, "ben comportate", come il Weibull). Quindi, sebbene spesso possa essere approssimativamente vero, spesso non lo è.
Quindi da dove viene Pearson? Come è arrivato a questa approssimazione?
Fortunatamente, Pearson ci dice praticamente la risposta.
Il primo uso del termine "skew" nel senso che lo stiamo usando sembra essere Pearson, 1895 [1] (appare proprio nel titolo). Questo documento sembra essere anche il luogo in cui introduce il termine mode (nota a piè di pagina, p345):
Ho trovato conveniente usare la modalità termine per l'ascissa corrispondente all'ordinata di massima frequenza. La "media", la "modalità" e la "mediana" hanno tutti caratteri distinti importanti per lo statistico.
Sembra anche essere il suo primo vero dettaglio del suo sistema di curve di frequenza .
Quindi, nel discutere la stima del parametro di forma nella distribuzione di Pearson Tipo III (quella che ora chiameremmo una gamma spostata - e possibilmente capovolta -), dice (p375):
La media, la mediana e la modalità o ordinata massima sono contrassegnate rispettivamente da bb , cc e aa , e non appena sono state disegnate le curve, si è manifestata una relazione notevole tra la posizione delle tre quantità: la mediana, quindi fintanto che era positivo * è stato visto essere circa un terzo dalla media verso il massimo †p†
* questo corrisponde alla gamma con parametro di forma >1
qui l'intento di "massimo" è il valore x della frequenza massima (la modalità), come è chiaro dall'inizio della citazione, non il massimo della variabile casuale.†x
E infatti, se osserviamo il rapporto tra (media-modalità) e (media-mediana) per la distribuzione gamma, osserviamo questo:
(La parte blu indica la regione che Pearson afferma che l'approssimazione è ragionevole).
αβ
β−−√−α−−√=kβ−−√−α−−√αβ−−√−α−−√αββ−−√+α−−√=cβ−−√+α−−√αβ
α>10
eμ−σ2,eμeμ+σ2/2
eμeσ2/2−e−σ2eσ2/2−1σ232σ212σ2, quindi almeno per i piccoli σ2 dovrebbe valere anche per il lognormale.
Esistono un numero discreto di distribuzioni ben note - molte delle quali erano familiari a Pearson - per le quali è quasi vero per una vasta gamma di valori dei parametri; lo notò con la distribuzione gamma, ma avrebbe avuto l'idea confermata quando sarebbe arrivato a esaminare diverse altre distribuzioni che avrebbe probabilmente preso in considerazione.
[1]: Pearson, K. (1895),
"Contributi alla teoria matematica dell'evoluzione, II: Variazione obliqua del materiale omogeneo",
Transazioni filosofiche della Royal Society, Serie A, 186, 343-414
[ Senza copyright. Disponibile gratuitamente qui ]