Una trasformazione per cambiare l'inclinazione senza influire sulla curtosi?


11

Sono curioso di sapere se esiste una trasformazione che altera l'inclinazione di una variabile casuale senza influire sulla curtosi. Ciò sarebbe analogo al modo in cui una trasformazione affine di un RV influenza la media e la varianza, ma non l'inclinazione e la curtosi (in parte perché l'inclinazione e la curtosi sono definite invarianti ai cambiamenti di scala). È un problema noto?


Hai bisogno che la deviazione standard rimanga costante anche con questa trasformazione?
Russellpierce,

no, mi aspetto che non lo farà, ma l'eccesso di curtosi dovrebbe rimanere fisso. Mi aspetto che la trasformazione sia monotona, tuttavia, e preferibilmente deterministica.
shabbychef,

1
Yikes: guai alla persona che vuole dimostrare una funzione non deterministica è monotona.
Russellpierce,

Risposte:


6

La mia risposta è l'inizio di un hack totale, ma non sono a conoscenza di alcun modo stabilito per fare ciò che chiedi.

Il mio primo passo sarebbe quello di classificare in ordine il tuo set di dati, puoi trovare la posizione proporzionale nel tuo set di dati e poi trasformarlo in una distribuzione normale, questo metodo è stato usato in Reynolds & Hewitt, 1996. Vedi il codice R di seguito in PROCMiracle.

Una volta che la distribuzione è normale, il problema è stato risolto, una questione di regolazione della curtosi ma non di inclinazione. Una ricerca su Google ha suggerito che si potrebbero seguire le procedure di John & Draper, 1980 per regolare la curtosi ma non l'inclinazione, ma non ho potuto replicare quel risultato.

I miei tentativi di sviluppare una funzione di spreading / restringimento del greggio che prende il valore di input (normalizzato) e aggiunge o sottrae un valore da esso proporzionale alla posizione della variabile sulla scala normale provoca un aggiustamento monotonico, ma in pratica tende a creare una distribuzione bimodale, sebbene abbia i valori di asimmetria e curtosi desiderati.

Mi rendo conto che questa non è una risposta completa, ma ho pensato che potesse fornire un passo nella giusta direzione.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Avevo fatto qualcosa del genere: classifica, quindi usa la trasformazione g-e-h per ottenere una curtosi e inclinazione fisse. Tuttavia, questa tecnica presuppone che io conosca effettivamente la curtosi della popolazione, che posso stimare, ma sono interessato, filosoficamente, se c'è una trasformazione che preserva la curtosi senza che io debba sapere di cosa si tratta ...
shabbychef,

@shabbychef: Oh, beh, allora scusa per non aver aggiunto nulla di nuovo. Tuttavia, hai aggiunto qualcosa di nuovo, non avevo mai sentito parlare della formula g-and-h prima. Hai una citazione liberamente accessibile che la fornisce? Mi sono imbattuto in un documento con esso spiegato ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) ma l'idea è un po 'estranea a me (in particolare è che e ^ Z ^ g o qualcos'altro )? L'ho provato in questo modo ... ma i risultati sembravano strani ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
Russellpierce,

1
@drnexus: non volevo distorcere i risultati citando la mia tecnica. Ho appreso delle distribuzioni g-and-h e g-and-k da Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 , e Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

Un'altra possibile tecnica interessante è venuta in mente, sebbene ciò non risponda perfettamente alla domanda, è quella di trasformare un campione in modo da avere un L-skew campione e una L-curtosi (così come una media fissa e scala L). Questi quattro vincoli sono lineari nelle statistiche degli ordini. Mantenere la trasformazione monotonica su un campione di osservazioni richiederebbe quindi altre equazioni . Questo potrebbe quindi essere posto come un problema di ottimizzazione quadratica: minimizzaren - 1 2nn12norma tra le statistiche dell'ordine di esempio e la versione trasformata soggetta ai vincoli indicati. Questo è un tipo di approccio stravagante, però. Nella domanda originale, stavo cercando qualcosa di più semplice e fondamentale. Stavo anche implicitamente cercando una tecnica che potesse essere applicata alle singole osservazioni, indipendentemente dall'intera coorte di campioni.


0

Preferirei modellare questo set di dati utilizzando una distribuzione leptokurtic anziché utilizzare trasformazioni di dati. Mi piace la distribuzione sinh-arcsinh di Jones e Pewsey (2009), Biometrika.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.