La visualizzazione è una logica sufficiente per trasformare i dati?


13

Problema

Vorrei tracciare la varianza spiegata da ciascuno dei 30 parametri, ad esempio come un grafico a barre con una barra diversa per ciascun parametro e la varianza sull'asse y:

testo alternativo

Tuttavia, le varianze sono fortemente inclinate verso valori piccoli, incluso 0, come si può vedere nell'istogramma seguente:

testo alternativo

Se li trasformo con , sarà più facile vedere le differenze tra i piccoli valori (istogramma e grafico a barre in basso):log(x+1)

testo alternativotesto alternativo

Domanda

La stampa su scala logaritmica è comune, ma la trama log(x+1) altrettanto ragionevole?

Risposte:


13

Questo è stato definito un " logaritmo avviato " da alcuni ( ad esempio , John Tukey). (Per alcuni esempi, Google John Tukey "ha iniziato il registro" .)

Va benissimo da usare. In effetti, potresti aspettarti di dover utilizzare un valore iniziale diverso da zero per tenere conto dell'arrotondamento della variabile dipendente. Ad esempio, arrotondando la variabile dipendente al numero intero più vicino si elimina efficacemente 1/12 dalla sua varianza reale, suggerendo che un valore iniziale ragionevole dovrebbe essere almeno 1/12. (Questo valore non fa un cattivo lavoro con questi dati. L'uso di altri valori sopra 1 non cambia molto l'immagine, ma aumenta quasi uniformemente tutti i valori nella trama in basso a destra.)

Esistono motivi più profondi per utilizzare il logaritmo (o il registro avviato) per valutare la varianza: ad esempio, la pendenza di un diagramma di varianza rispetto al valore stimato su una scala del registro di registro stima un parametro Box-Cox per stabilizzare la varianza . Si osservano spesso simili adattamenti della legge del potere alla varianza di alcune variabili correlate. (Questa è un'affermazione empirica, non teorica.)

Se il tuo scopo è presentare le variazioni, procedi con cura. Molti pubblici (a parte quelli scientifici) non riescono a capire un logaritmo, tanto meno uno iniziato. L'uso di un valore iniziale di 1 ha almeno il merito di essere un po 'più semplice da spiegare e interpretare rispetto ad altri valori iniziali. Qualcosa da considerare è quello di tracciare le loro radici, che sono le deviazioni standard, ovviamente. Sarebbe simile a questo:

testo alternativo

Indipendentemente da ciò, se il tuo scopo è esplorare i dati, imparare da essi, adattarli a un modello o valutare un modello, allora non lasciare che nulla ostacoli il modo di trovare rappresentazioni grafiche ragionevoli dei tuoi dati e valori derivati ​​dai dati come queste variazioni.


1
grazie per la spiegazione e la terminologia / riferimento corretti. Il pubblico è il lettore di una rivista scientifica e l'argomento è la decomposizione della varianza; comprendere il concetto di trasformazione del log è un prerequisito, ma non ero ancora sicuro che questa presentazione richiedesse ulteriori giustificazioni: le radici sono una buona alternativa. Grazie.
David LeBauer,

3

Può essere ragionevole La domanda migliore da porsi è se 1 è il numero corretto da aggiungere. Qual era il tuo minimo? Se era 1 per cominciare, allora stai imponendo un intervallo particolare tra gli elementi con valore pari a zero e quelli con valore 1. A seconda del dominio di studio, potrebbe essere più sensato scegliere 0,5 o 1 / e come offset. L'implicazione della trasformazione in una scala di registro è che ora hai una scala di rapporto.

Ma sono infastidito dalle trame. Vorrei chiedere se un modello che presenta la maggior parte della varianza spiegata nella coda di una distribuzione distorta debba essere considerato avere proprietà statistiche desiderabili. Penso di no.


Non sono sicuro che sia chiaro, ma gli istogrammi sono dei 30 valori della varianza e i grafici a barre sono i valori grezzi della varianza, cioè var <- c(0,0,1,3,10,100,150), hist(var), barplot(var), quindi interpreto questo come alcuni parametri spiegano la maggior parte della varianza, non la maggior parte della varianza spiegata è nella coda. Ha più senso? Scusa se non è chiaro.
David LeBauer,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.