Qual è la differenza tra una funzione di perdita e una funzione di errore?


31

Il termine "perdita" è sinonimo di "errore"? C'è una differenza nella definizione?

Inoltre, qual è l'origine del termine "perdita"?

NB: La funzione di errore menzionata qui non deve essere confusa con un errore normale.


1
La mia domanda è collegata a questa, ma non l'ho trovata soddisfacente stats.stackexchange.com/questions/179026/…
Dan Kowalczyk,

1
Sarebbe utile se potessi indicare ciò che ritieni insoddisfacente riguardo al thread correlato.
S. Kolassa - Ripristina Monica il

1
Non affronta in particolare la funzione di errore e si concentra principalmente sui tipi di perdita
Dan Kowalczyk,

Risposte:


57

Nel contesto di un modello predittivo o inferenziale, il termine "errore" si riferisce generalmente alla deviazione da un valore effettivo a una previsione o aspettativa di tale valore. È determinato interamente dal meccanismo di predizione e dall'effettivo comportamento delle quantità sotto osservazione. La "perdita" è una misura quantificata di quanto sia grave ottenere un errore di una determinata dimensione / direzione, che è influenzato dalle conseguenze negative che si accumulano per una previsione imprecisa.

Una funzione di errore misura la deviazione di un valore osservabile da una previsione, mentre una funzione di perdita opera sull'errore per quantificare la conseguenza negativa di un errore. Ad esempio, in alcuni contesti potrebbe essere ragionevole supporre che vi sia una perdita quadrata di errore , in cui la conseguenza negativa di un errore è quantificata come proporzionale al quadrato dell'errore. In altri contesti potremmo essere maggiormente influenzati negativamente da un errore in una determinata direzione (ad es. Falso positivo vs. falso negativo) e pertanto potremmo adottare una funzione di perdita non simmetrica.

La funzione di errore è un oggetto puramente statistico, mentre la funzione di perdita è un oggetto teorico decisionale che stiamo introducendo per quantificare le conseguenze negative dell'errore. Quest'ultimo è usato nella teoria delle decisioni e nell'economia (di solito attraverso il suo opposto - una funzione di utilità cardinale).


Un esempio: sei un criminale racket che gestisce una sala di scommesse illegale per la mafia. Ogni settimana devi pagare il 50% dei profitti al capo Mob, ma dal momento che gestisci il posto, il capo si affida a te per dare una vera contabilità dei profitti. Se hai una buona settimana potresti riuscire a trattenerlo da un po 'di impasto rappresentando il tuo profitto, ma se paghi meno il capo, rispetto a quello che sospetta sia il vero profitto, sei un uomo morto. Quindi vuoi prevedere quanto si aspetta di ottenere e pagare di conseguenza. Idealmente gli darai esattamente quello che si aspetta, e manterrai il resto, ma potresti potenzialmente fare un errore di previsione e pagarlo troppo, o (yikes!) Troppo poco.

π=$40,00012π=$20,000θ=$15,000θ^

Error(θ^,θ)=θ^θ,

e (se assumiamo che la perdita sia lineare in denaro) la tua funzione di perdita è:

Loss(θ^,θ)={if θ^<θ(sleep wit' da fishes)θ^πif θ^θ(live to spend another week)

Questo è un esempio di una funzione di perdita asimmetrica (soluzione discussa nei commenti seguenti) che differisce sostanzialmente dalla funzione di errore. La natura asimmetrica della funzione di perdita in questo caso sottolinea l'esito catastrofico nel caso in cui vi sia una sottostima del parametro sconosciuto.


2
Molto chiaro, grazie per la tua risposta. Accetterò una risposta dopo che gli altri avranno una possibilità.
Dan Kowalczyk il

4
Questo nuovo esempio sembra provenire dall'esperienza personale ...
Dan Kowalczyk,

2
L'esempio è formidabile.
Greenstick,

Mentre l'esempio è divertente, una perdita infinita è piuttosto insignificante. La soluzione ottimale in questo caso sarebbe sempre quella di dare al tuo capo tutti i soldi guadagnati. Suggerisco di cambiarlo perché la risposta sia davvero eccellente.
Alex bGoode,

1
Sembra che ci siano opinioni diverse sull'esempio, quindi per il momento lo lascerò così com'è, ma sono aperto a una modifica se si rivela impopolare. Detto questo, lo scopo nel presente contesto è di mostrare all'OP un esempio di una funzione di perdita altamente asimmetrica, per sottolineare la differenza con la funzione di errore. Il fatto che la soluzione ottimale sia dare al capo tutti i soldi non rende l'esempio "insignificante" - significa solo che la soluzione ottimale è dare al capo tutti i soldi.
Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.