Qual è la differenza tra una funzione di perdita e una funzione di decisione?


Risposte:


45

Una funzione decisionale è una funzione che accetta un set di dati come input e fornisce una decisione come output. Quale può essere la decisione dipende dal problema attuale. Esempi inclusi:

  • Problemi di stima: la "decisione" è la stima.
  • Problemi di verifica dell'ipotesi: la decisione è di rifiutare o non rifiutare l'ipotesi nulla.
  • Problemi di classificazione: la decisione è quella di classificare una nuova osservazione (o osservazioni) in una categoria.
  • Problemi di selezione del modello: la decisione è quella di scegliere uno dei modelli candidati.

In genere, esiste un numero infinito di funzioni decisionali disponibili per un problema. Se ad esempio siamo interessati a stimare l'altezza dei maschi svedesi sulla base di dieci osservazioni , possiamo usare una delle seguenti funzioni decisionali :d ( x )X=(X1,X2,...,X10)d(X)

  • La media di esempio: .d(X)=110Σio=110Xio
  • La mediana del campione:d(X)=mediano(X)
  • La media geometrica del campione:d(X)=X1X1010
  • La funzione che restituisce sempre 1: , indipendentemente dal valore di . Stupido, sì, ma è comunque una valida funzione decisionale.xd(X)=1X

Come possiamo quindi determinare quale di queste funzioni decisionali usare? Un modo è utilizzare una funzione di perdita , che descrive la perdita (o il costo) associata a tutte le possibili decisioni. Diverse funzioni decisionali tenderanno a generare diversi tipi di errori. La funzione di perdita ci dice che tipo di errori dovremmo essere più preoccupati. La funzione di decisione migliore è la funzione che produce la perdita minima prevista . Cosa si intende per perdita attesa dipende dall'impostazione (in particolare, se stiamo parlando di statistiche frequentiste o bayesiane ).

In sintesi:

  • Le funzioni decisionali vengono utilizzate per prendere decisioni in base ai dati.
  • Le funzioni di perdita vengono utilizzate per determinare quale funzione di decisione utilizzare.

Per le funzioni di decisione parametriche (ad es. Regressione logistica, decisione di soglia) si ha sostanzialmente una possibile funzione per ciascuna combinazione di parametri e la funzione di perdita viene utilizzata per trovare la migliore. Esempio comune: se si utilizza la discesa gradiente per esplorare lo spazio dei parametri, si ricava la perdita rispetto ai parametri e si scende al minimo (locale) della perdita.
pixelou,

7

La funzione di perdita è ciò che è minimizzato per ottenere un modello che è ottimale in un certo senso. Il modello stesso ha una funzione decisionale che viene utilizzata per prevedere.

Ad esempio, nei classificatori SVM:

  • funzione di perdita: minimizza l'errore e la norma quadrata dell'iperpiano di separazioneL(w,ξ)=12w2+CΣioξio
  • funzione decisionale: distanza firmata dall'iperpiano di separazione:f(X)=wTX+B

Non è la norma uguale alla distanza, o mescolo qualcosa qui ... Quindi la funzione decisionale è sempre una parte della funzione di perdita che uso per "confrontare" con i valori reali a cui cerco di fissare un modello? E l'obiettivo è ridurre al minimo questa "differenza"?
www.pieronigro.de,

@Hiatus la norma dell'iperpiano di separazione (che viene ottimizzato durante l'addestramento di un SVM) non viene utilizzata nella funzione decisionale. Viene utilizzato l'iperpiano stesso. Ridurre al minimo la norma durante l'allenamento è sostanzialmente una forma di regolarizzazione.
Marc Claesen,

Sarebbe meglio dare una risposta più generica che non sia legata a nessun classificatore specifico.
smci,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.