Un modello è adattato ai dati o i dati sono adattati a un modello?


20

Esiste una differenza concettuale o procedurale tra l'adattamento di un modello ai dati e l'adattamento dei dati al modello? Un esempio della prima formulazione può essere visto in https://courses.washington.edu/matlab1/ModelFitting.html e della seconda in https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .


7
+1 Non sono impressionato dal secondo link, ma sono divertito.
Il Laconic il

Molti modelli si adattano ai dati attuali, ma i dati in genere si adattano al miglior modello
Agnius Vasiliauskas il

Risposte:


35

Praticamente ogni fonte o persona con cui abbia mai interagito tranne la fonte Wolfram che hai collegato si riferisce al processo come adattamento di un modello ai dati . Ciò ha senso, poiché il modello è l'oggetto dinamico e i dati sono statici (ovvero fissi e costanti).

Per dirlo, mi piace l'approccio di Larry Wasserman a questo. Nel suo racconto, un modello statistico è una raccolta di distribuzioni. Ad esempio, la raccolta di tutte le distribuzioni normali:

{Normale(μ,σ):μ,σR,σ>0}

o l'insieme di tutte le distribuzioni di Poisson:

{poisson(λ):λR,λ>0}

Adattare una distribuzione ai dati è qualsiasi algoritmo che combina un modello statistico con un insieme di dati (i dati sono fissi) e sceglie esattamente una delle distribuzioni dal modello come quella che "meglio" riflette i dati.

Il modello è la cosa che cambia (in un certo senso): lo stiamo collassando da un'intera raccolta di possibilità in un'unica scelta migliore. I dati sono solo i dati; non succede nulla.


16

Nel campo della modellazione Rasch è comune adattare i dati al modello. Si presume che il modello sia corretto ed è compito dell'analista trovare dati conformi ad esso. L' articolo di Wikipedia su Rasch contiene maggiori dettagli su come e perché.

Ma sono d'accordo con gli altri sul fatto che, in generale, nelle statistiche adattiamo il modello ai dati perché possiamo cambiare il modello, ma si ritiene che sia una forma sbagliata selezionare o modificare i dati.


7

In genere, i dati osservati vengono corretti mentre il modello è mutabile (ad es. Perché i parametri sono stimati), quindi è il modello creato per adattarsi ai dati, non viceversa . (Di solito le persone intendono questo caso quando dicono entrambe le espressioni.)

Quando le persone dicono di adattare i dati a un modello, mi ritrovo a cercare di capire cosa diavolo hanno fatto ai dati? .

[Ora, se stai trasformando i dati , sarebbe probabilmente 'adattando i dati a un modello', ma la gente non lo dice quasi mai per questo caso.]


5
La rimozione di valori anomali sarebbe anche (probabilmente) "adattamento dei dati a un modello".
Federico Poloni,

1
Il fraseggio potrebbe avere senso se lo stanno pensando come "adattamento (dati a un modello)". Cioè, stai facendo un processo di adattamento e quel processo di adattamento inizia dai dati e lo trasforma in un modello. Concordo sul fatto che sia un'interpretazione meno comune / accurata rispetto all'analisi "(adattando X) a Y", ma la espongo come una logica sul perché qualcuno potrebbe logicamente dirlo.
RM

1
I valori anomali di @FedericoPoloni sono generalmente definiti indipendentemente dal modello che in seguito si desidera utilizzare. Quindi, anche se vorremmo chiamarlo dati adeguati, non sarebbe un modello, ma a qualcos'altro.
BartoszKP,

1
+1. C'è una ragione per cui si chiama "dati" - è ciò che viene dato , vedi l'origine latina della parola: latindictionary.wikidot.com/verb:dare
Christoph Hanck

2

Di solito, supponiamo che i nostri dati corrispondano al "mondo reale" e apportare modifiche significa che ci stiamo allontanando dalla modellazione del "mondo reale". Ad esempio, bisogna fare attenzione a rimuovere i valori anomali poiché, anche se rende il calcolo più gradevole, i valori anomali facevano ancora parte dei nostri dati.

Quando testiamo un modello o stimiamo le proprietà di uno stimatore usando bootstrap o altre tecniche di ricampionamento, possiamo simulare nuovi dati usando un modello stimato e i nostri dati originali. Questo presuppone che il modello sia corretto e non stiamo modificando i nostri dati originali.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.