In statistica, dovrei supporre che significhi o il logaritmo naturale ?


18

Sto studiando le statistiche e spesso mi imbatto in formule contenenti il loge sono sempre confuso se dovrei interpretarlo come significato standard di log, cioè base 10, o se nelle statistiche il simbolo log è generalmente considerato il log naturale ln.

In particolare sto studiando la stima della frequenza di Good-Turing come esempio, ma la mia domanda è più generale.


2
"Per molte applicazioni, il logaritmo naturale della funzione di verosimiglianza, chiamato log-verosimiglianza, è più conveniente con cui lavorare." en.wikipedia.org/wiki/Likelihood_function#Log-likelihood Nelle statistiche spesso lavoriamo con la funzione di verosimiglianza, di solito è quello lnche viene considerato. Tuttavia, i due sono correlati: log(x) = ln(x) / ln(10) = ln(x) / 2.303e la funzione ln -likelihood raggiunge l'estremo nello stesso punto della funzione log10 -likelihood.
John_West,

5
In alcune aree di applicazione particolari, quando viene menzionato , si intende la base 10, ma come indica Aksakal, altrimenti è la convenzione usata in matematica - che un senza ornamenti significa log naturale. logloglog
Glen_b -Restate Monica

2
Come dice @John_West e sono identici fino a un fattore di ridimensionamento. Quindi sono gli stessi che misuri in un'altra unità. l o g a ( x )ln(x)loga(x)

1
@Aksakal; ciò che dici viene a dire che l'unità è importante (vedi il mio commento sopra), con cui concordo. Ho anche scritto per indicare esplicitamente la base. Per (alcune) applicazioni in statistiche come la massima probabilità, questo fattore di ridimensionamento è comunque irrilevante. Il massimo non cambierà dopo aver aggiunto il fattore di ridimensionamento. Nel riferimento dell'OP (good-turing ...) vogliono tracciare il (o ) rispetto al . Ciò significa che l'unità cambia su entrambi gli assi del grafico in modo che la '' curva '' tracciata non cambi. l o g ( N r ) l o g ( Z r ) l o g ( r )logalog(Nr)log(Zr)log(r)

1
A meno che tu non stia scrivendo un documento, anche quando usi la verosimiglianza, la scala (base del logaritmo) di solito conta. Ad esempio, le statistiche del test del rapporto di verosimiglianza log usano , dovresti adeguarti da un'altra base per usare i valori critici. Se stai scrivendo un software, è importante ottenere la base giusta quando si usano le funzioni di verosimiglianza dai documenti, ecc. Ci sono troppi casi in cui la base è importante per affermare che non ha importanza. ln
Aksakal,

Risposte:


20

È sicuro supporre che senza base esplicita nelle statistiche, perché il registro di base 10 non viene usato molto spesso nelle statistiche. Tuttavia, altri poster evidenziano che o altre basi possono essere comuni in alcuni altri campi, in cui vengono applicate le statistiche, ad esempio la teoria dell'informazione. Quindi, quando leggi articoli in altri campi, a volte diventa confuso.log 10log=lnlog10

La pagina entropia di Wikipedia è un buon esempio di uso confuso di . Nella stessa pagina significano base 2, qualsiasi base. Puoi capire dal contesto quale si intende, ma richiede la lettura del testo. Questo non è un buon modo per presentare il materiale. Confrontalo con la pagina Logarithm in cui la base è chiaramente mostrata in ogni formula o viene utilizzato. Personalmente penso che questa sia la strada da percorrere: mostra sempre la base quando viene usato il segno . Questo sarebbe anche conforme ISO per lo standard che non definisce l'utilizzo di una base non specificata con il simbolo come ha sottolineato @Henry.e ln log loglogelnloglog

Infine, lo standard ISO 31-11 prescrive i segni e per i logaritmi di base 2 e 10. Entrambi sono usati raramente in questi giorni. Ricordo che scuola superiore, ma era in un altro secolo in un altro mondo. Non l'ho più visto da allora usato in un contesto statistico. Non c'è nemmeno il tag per in LaTeX.lg lg lblblglglb


1
I logaritmi di base 2 sono anche abbastanza comuni in alcuni campi. Il registro senza ornamenti è raramente base 10, ma non è sempre base e .
Nuclear Wang,

Utile, ma penso che "raramente" sia troppo forte. Esistono campi sostanziali in cui le persone possono conoscere solo, o nella migliore delle ipotesi, i logaritmi di base 10. Si noti che molti grafici mostrano scale logaritmiche usando potenze di 10. Qualcuno che preferisce i logaritmi naturali non ha difficoltà a decodificare tali scale, ma la presunzione è di base 10.
Nick Cox

@NickCox, OP specifica specificamente "statistiche" come un campo e non vedo spesso il logaritmo di base 10 usato nelle statistiche.
Aksakal,

ISO 31-11 sembra specificare per e lasciare un non non definitolog e di registrolnlogelog
Henry

1
@NickCox, ho ammorbidito la lingua, hai sollevato un punto giusto
Aksakal

14

Dipende.

Al di fuori di alcuni contesti, come la conversione di un valore in decibel, i logaritmi di base 10 sono piuttosto rari nelle equazioni. Tuttavia, i grafici in scala logaritmica sono spesso in base-10, anche se questo dovrebbe essere abbastanza facile da verificare dalle etichette sugli assi.

In un contesto matematico, un non decorato è probabilmente il log naturale (ovvero, o ). D'altra parte, l'informatica usa spesso i logaritmi di base 2 ( ) e non sono sempre chiaramente indicati come tali. La buona notizia è che puoi convertire banalmente tra basi e usare la base "sbagliata" renderà la tua risposta solo un fattore costante.log e ln log 2loglogelnlog2

Nel documento "Good-Turing Without Tears" del 1995 di Gale , i logaritmi nel testo sono in realtà (lo dice a pagina 5), ​​ma il codice R / S + nell'appendice utilizza la funzione, che è in realtà o . Come sottolinea @Henry di seguito, questo non fa alcuna differenza pratica. log e lnlog10loglogeln

Se fossi costretto a indovinare, ecco alcune euristiche:

  • Se sono presenti anche potenze di 2, o 10, è probabile che i registri abbiano la base corrispondente.e

  • Se deriva dall'integrazione di (o, più in generale, implica il calcolo), è probabile che sia un log naturale.1/x

  • Se deriva dalla divisione ripetuta di qualcosa a metà (come nella ricerca binaria), è probabile che sia . Più in generale, qualcosa può essere diviso per circa volte. n log nlog2nlogn

  • I calcoli teorici delle informazioni usano tipicamente , specialmente nel lavoro moderno. Tuttavia, puoi controllare le unità per essere sicuro: , e .bitlog 2 natsln divietilog 10log2bitslog2natslnbanslog10

  • Trovare il punto in cui una funzione cade o sale a , (rispettivamente 37% e 63%) di un valore iniziale suggerisce un naturale log.1e or 11e


5
+1. Un piccolo suggerimento è che se gli exponentials si trovano nelle vicinanze, allora il logaritmo naturale è più probabile e al contrario con potenze di 10 o 2. Se quale base viene utilizzata rimane poco chiara, prova a riprodurre i calcoli di esempio degli autori. exp()
Nick Cox,

2
Poiché i grafici alle pagine 6 e 7 dell'articolo di Gale mostrano le unità originali su una scala logaritmica e i calcoli sono finalizzati alla pendenza di una relazione log-log, ovvero nel log delle espressioni ( N r ) = a + b log ( r ) che corrisponde a N r = A r b , in questo caso non fa alcuna differenza praticablog(Nr)=a+blog(r)Nr=Arb
Henry,

2
Un altro esempio di è quando si tracciano i dati del mercato azionario, quando si utilizza un asse dei prezzi dei tronchi è sempre base 10.base10
Marcus D

3

Per rispondere alla tua domanda: no, non puoi assumere una notazione fissa generale per il logaritmo.

Una domanda simile è stata recentemente discussa in SE.Math: Qual è la differenza tra i tre tipi di logaritmi? da un punto di vista matematico. In generale, ci sono diverse notazioni che dipendono dalle abitudini (il sembra utile nella ricerca medica ) o dalla lingua (ad esempio in tedesco, russo, francese). Sfortunatamente, la stessa notazione a volte finisce per rappresentare definizioni diverse. Citando dal link SE.Math sopra:log10

lnxlogexelogx10log10

log2log2loge

0

loglogelog10


0

eln(L^)L^k

AIC=2(kln(L)).

Quindi sembra che se usi qualsiasi altra base per il logaritmo nell'AIC, potresti finire per trarre una conclusione sbagliata e selezionare il modello sbagliato.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.