Qual è la differenza tra previsione e inferenza?


37

Sto leggendo " Un'introduzione all'apprendimento statistico ". Nel capitolo 2, discutono il motivo della stima di una funzione .f

2.1.1 Perché stimare ?f

Ci sono due motivi principali per cui potremmo voler stimare f : previsione e inferenza . Ne discutiamo a turno.

L'ho letto più volte, ma in parte non sono ancora chiaro sulla differenza tra previsione e inferenza. Qualcuno potrebbe fornire un esempio (pratico) delle differenze?


5
Gli autori di An Introduction to Statistical Learning ci hanno fatto un disservizio qui. Si fanno inferenze per fare previsioni proprio come si fanno inferenze per comprendere cause ed effetti. Merriam-webster.com definisce "infer" principalmente come "trarre una conclusione da fatti o premesse". Questo riguarda sia il ragionamento causale che predittivo. È fuorviante, confuso e contro l'uso standard a lungo termine restringere la definizione di "infer" per includere solo questioni di causalità. Quindi: contrastiamo l'inferenza predittiva con l'inferenza causale.
rolando2,

2
@ rolando2: Quindi suppongo che abbiamo bisogno anche dell'inferenza descrittiva , cioè dell'inferenza sui parametri nei modelli descrittivi (non causali).
kjetil b halvorsen,

Risposte:


29

Inferenza: dato un insieme di dati che si desidera dedurre come viene generato l'output in funzione dei dati.

Previsione: data una nuova misurazione, si desidera utilizzare un set di dati esistente per creare un modello che scelga in modo affidabile l'identificatore corretto da un set di risultati.


Inferenza: vuoi scoprire quali sono gli effetti di Age, Passenger Class e Gender sulla sopravvivenza del Titanic Disaster. Puoi fare una regressione logistica e dedurre l'effetto che ogni caratteristica del passeggero ha sui tassi di sopravvivenza.

Previsione: date alcune informazioni su un passeggero Titanic, si desidera scegliere dal set ed essere corretti il ​​più spesso possibile. (Vedi il compromesso della variazione di polarizzazione per la previsione nel caso in cui ti chiedi come essere corretto il più spesso possibile.){vite,muore}


La previsione non ruota attorno allo stabilire la relazione più accurata tra input e output, la previsione accurata si preoccupa di mettere nuove osservazioni nella giusta classe il più spesso possibile.

Quindi, l '"esempio pratico" si riduce grossolanamente alla seguente differenza: dato un insieme di dati di passeggeri per un singolo passeggero, l'approccio di inferenza ti dà una probabilità di sopravvivere, il classificatore ti offre una scelta tra vite o morti.

L'ottimizzazione dei classificatori è un argomento molto interessante e cruciale come lo è l'interpretazione corretta dei valori p e degli intervalli di confidenza.


1
Buona risposta. Ma quando alcune persone sentono la parola "inferenza", pensano "inferenza causale". Potresti voler dire qualcosa anche su questo, anche se (o forse soprattutto perché) ISLR non è concentrato su di esso.
generic_user

1
Penso che l'inferenza del mondo dell'apprendimento profondo sia praticamente la stessa della previsione, ad es. blogs.nvidia.com/blog/2016/08/22/…
user1893354

1
Questa mi sembra una risposta perfettamente valida.
gung - Ripristina Monica

3
Credo che questa risposta sia sbagliata, in particolare "l'approccio di inferenza ti dà una probabilità di sopravvivere, il classificatore ti dà una scelta tra vite o muori", ancor più specificamente la prima parte. Calcolare la probabilità che un passeggero sopravviva è una previsione, in particolare una probabilità. Nel caso continuo sarebbe una previsione di densità. Possiamo quindi soglie questa probabilità prevista per ottenere una classificazione difficile , sì. ...
S. Kolassa - Ripristina Monica il

3
... Mentre la previsione riguarda la previsione dei risultati , l'inferenza riguarda la comprensione della relazione degli input con il risultato: quale input ha una tale relazione e come possiamo distinguere una relazione "vera" dalla covariazione casuale (che è dove i valori p entra)? Qualcuno può spiegarmi dove mi sbaglio?
S. Kolassa - Ripristina Monica il

12

Generalmente, quando si esegue l'analisi dei dati, immaginiamo che esista una sorta di "processo di generazione dei dati" che dà origine ai dati e l'inferenza si riferisce all'apprendimento della struttura di questo processo, mentre la previsione significa essere in grado di prevedere effettivamente i dati che ne derivano . Spesso i due vanno insieme, ma non sempre.

Un esempio in cui i due vanno di pari passo sarebbe il semplice modello di regressione lineare

Yio=β0+β1Xio+εio.

Inferenza in questo caso significherebbe stimare i parametri del modello e β 1β0β1 e le nostre previsioni verrebbero semplicemente calcolate dalle nostre stime di questi parametri. Ma ci sono altri tipi di modelli in cui si è in grado di fare previsioni sensate, ma il modello non porta necessariamente a intuizioni significative su ciò che sta accadendo dietro le quinte. Alcuni esempi di questo tipo di modelli potrebbero essere complessi metodi di ensemble che possono portare a buone previsioni ma a volte sono difficili o impossibili da capire.


3
"ma il modello non porta necessariamente a intuizioni significative su ciò che sta accadendo dietro le quinte". Mi viene in mente il termine " scatola nera ". :)
Alexis,

o reti neurali multistrato
Shihab Shahriar Khan

"Ma ci sono altri tipi di modelli in cui si è in grado di fare previsioni sensate, ma il modello non porta necessariamente a intuizioni significative su ciò che sta accadendo dietro le quinte.", A chi importa? Il problema di inferenza, come lo hai definito, è ancora quello di determinare i parametri del modello. Non capisco perché inizi questa frase con "Ma" e perché hai persino scritto questa frase, rispetto alla tua definizione di inferenza e previsione.
nbro

1
L'uso di "ma" è perché sia ​​la descrizione dei modelli precedenti che seguenti sono corretti, tuttavia il modello seguente è distinto dalla natura del primo in modi che non ti saresti aspettato finché non avessi compreso la distinzione tra previsione e inferenza che viene illustrato. Ho già familiarità con la distinzione, tuttavia, trovo questo esempio perspicace e utile. +1
gung - Ripristina Monica

11

Nella pagina 20 del libro, gli autori forniscono un bell'esempio che mi ha fatto capire la differenza.

Ecco il paragrafo del libro: Introduzione all'apprendimento statistico

"Ad esempio , in un contesto immobiliare, si potrebbe cercare di mettere in relazione i valori delle case con input come tasso di criminalità, suddivisione in zone, distanza da un fiume, qualità dell'aria, scuole, livello di reddito della comunità, dimensioni delle case e così via. In questo caso si potrebbe essere interessati a come le singole variabili di input influenzano i prezzi, vale a dire quanto varrà una casa se ha una vista sul fiume? Questo è un problema di inferenza . In alternativa, si potrebbe semplicemente essere interessati nel predire il valore di una casa date le sue caratteristiche: questa casa è sottovalutata o sopravvalutata? Questo è un problema di predizione ".


5

ytX1,tX2,t

yt=f(X1,t-1,X2,t-1)+εt

Ora, se ottenete i dati sul reddito, dite le serie di reddito disponibile personale da BEA e costruite la variabile del periodo dell'anno, potete stimare la funzione f , quindi inserire gli ultimi valori del reddito della popolazione e il periodo dell'anno in questo funzione. Ciò produrrà la previsione per il prossimo trimestre delle entrate del negozio.

f/X2tβ2X2,t-1 .

Xsono correlati è più difficile separare l'impatto del predittore dall'impatto di altri predittori. Per la previsione questo non ha importanza, tutto ciò che ti interessa è la qualità della previsione.


3

Immagina di essere un medico in un'unità di terapia intensiva. Hai un paziente con una forte febbre e un determinato numero di cellule del sangue e un dato peso corporeo e un centinaio di dati diversi e vuoi prevedere se sopravviverà. Se sì, nasconderà quella storia dell'altro figlio a sua moglie, in caso contrario, è importante che lo riveli, mentre può.

Il medico può fare questa previsione in base ai dati degli ex pazienti che aveva nella sua unità. Sulla base delle sue conoscenze di software, può prevedere utilizzando una regressione lineare generalizzata (glm) o tramite una rete neurale (nn).

1. Modello lineare generalizzato

Esistono molti parametri correlati per il glm, quindi per arrivare a un risultato, il medico dovrà fare ipotesi (linearità ecc.) E decisioni su quali parametri possono avere un'influenza. Il glm lo ricompenserà con un t-test di significato per ciascuno dei suoi parametri in modo che possa raccogliere forti prove, che il genere e la febbre hanno un'influenza significativa, il peso corporeo non è necessariamente così.

2. Rete neurale

La rete neurale inghiottirà e digerirà tutte le informazioni che ci sono nel campione di ex pazienti. Non importa se i predittori sono correlati e non rivelerà molte informazioni, se l'influenza del peso corporeo sembra essere importante solo nel campione a portata di mano o in generale (almeno non a livello di competenza che il medico ha da offrire). Calcolerà solo un risultato.

Cosa c'è di meglio

Quale metodo scegliere dipende dall'angolazione da cui si guarda al problema: come paziente, preferirei la rete neurale che utilizza tutti i dati disponibili per una migliore ipotesi su ciò che accadrà a me senza ipotesi forti e ovviamente sbagliate come la linearità. Come medico, che vuole presentare alcuni dati in un diario, ha bisogno di valori p. La medicina è molto conservatrice: chiederanno valori p. Quindi il medico vuole riferire che in tale situazione il genere ha un'influenza significativa. Per il paziente, non importa, basta usare qualsiasi influenza che il campione suggerisce sia più probabile.

In questo esempio, il paziente vuole la predizione, il lato scienziato del dottore vuole l'inferenza. Principalmente, quando vuoi capire un sistema, allora l'inferenza è buona. Se è necessario prendere una decisione in cui non è possibile comprendere il sistema, la previsione dovrà essere sufficiente.


1
"Come paziente, preferirei la rete neurale ..." Sembri ignorare il fatto che grandi quantità di dati possono essere estremamente difficili da trovare nella scienza clinica. I set di dati di diverse osservazioni per gruppo non sono insoliti a causa di problemi di sicurezza, privacy ed etica. Se riesci a fare ipotesi difendibili sul processo di generazione dei dati, puoi fare un uso molto più efficiente dei dati.
Frans Rodenburg,

Si supponeva che questo fosse uno scenario ipotetico in cui ci si può facilmente collegare al motivo per cui lo stesso apparente problema può far sorgere domande di inferenza e problemi di predizione e perché non sono gli stessi. Non stavo proponendo metodi per prevedere realmente le possibilità di sopravvivenza del paziente e sì, sono ben consapevole di quanto sia difficile ottenere dati clinici affidabili di dimensioni notevoli. Le buone ipotesi / conoscenza del processo di generazione dei dati di IMHO aiuteranno nella previsione e nell'inferenza, quindi non fanno molto per distinguere entrambi.
Bernhard

1

Non sei solo qui. Dopo aver letto le risposte, non sono più confuso, non perché capisco la differenza, ma perché capisco che è negli occhi di chi guarda e indotto verbalmente. Sono sicuro che ora questi due termini sono definizioni politiche piuttosto che scientifiche. Prendiamo ad esempio la spiegazione del libro, quella che le università hanno cercato di usare come una buona: "quanto extra varrà una casa se ha una vista sul fiume? Questo è un problema di inferenza". Dal mio punto di vista, questo è assolutamente un problema di previsione. Sei il proprietario di una società di costruzioni civili e vuoi scegliere il terreno migliore per costruire il prossimo set di case. Devi scegliere tra due località nella stessa città, una vicino al fiume, l'altra vicino alla stazione ferroviaria. Vuoi prevederei prezzi per entrambe le località. O vuoiinfer . Stai per applicare i metodi esatti delle statistiche, ma dai un nome al processo. :)


L'idea che una vista sul fiume richieda un certo prezzo è un'interpretazione causale . La previsione è agnostica riguardo alla causalità: posso prevedere effetti da cause, cause da effetti o 1 effetto da un altro effetto con cause simili. Considera il mio amico Billy, che è 5'10 "e che ha un gemello identico, Bobby, che non ho mai incontrato. Tuttavia, posso prevedere che Bobby è 5'10", ma se faccio Billy più alto dandogli scarpe da ascensore, Non posso necessariamente prevedere che anche Billy sarà più alto.
gung - Ripristina Monica

L'esempio che citi è semplicemente un cattivo esempio, ecco perché è confuso. C'è sicuramente di più nella differenza tra inferenza e preditività della "politica".
Richard Hardy,

1

Esistono buone ricerche che dimostrano che un forte predittore del fatto che i mutuatari rimborseranno i loro prestiti è se usano feltri per proteggere i loro pavimenti da graffi da gambe di mobili. Questa variabile "sentita" sarà un aiuto distinto per un modello predittivo in cui il risultato è ripagato rispetto al default. Tuttavia, se i finanziatori vogliono ottenere un maggiore effetto leva su questo risultato, saranno negligenti nel pensare di poterlo fare distribuendo le sensazioni il più ampiamente possibile.

"Con quale probabilità è rimborsato questo mutuatario?" è un problema di previsione; "Come posso influenzare il risultato?" è un problema di inferenza causale.


-1

y = f (x) quindi

previsione (qual è il valore di Y con un dato valore di x: se valore specifico di x quale potrebbe essere il valore di Y

inferenza (come y cambia con il cambio in x): quale potrebbe essere l'effetto su Y se x cambia

Esempio di previsione: supponiamo che y rappresenti lo stipendio di una persona, quindi se forniamo input come anni di esperienza, laurea come variabili di input, la nostra funzione prevede lo stipendio del dipendente.

Esempio di inferenza: supponiamo che il costo della vita cambi, quindi quanto costa il cambiamento di stipendio


Non vedo perché questa risposta meriti due voti negativi.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.