"Variabile fittizia" e "variabile indicatore" sono termini usati frequentemente per indicare l'appartenenza a una categoria con codifica 0/1; di solito 0: non un membro della categoria, 1: membro della categoria.
Il 26/11/2014 una rapida ricerca su scholar.google.com (con virgolette allegate) rivela che "variabile fittizia" viene utilizzata in circa 318.000 articoli e "variabile indicatore" in circa 112.000 articoli. Il termine "variabile fittizia" ha anche un significato in matematica non statistica di " variabile legata " che probabilmente contribuisce al maggiore uso di "variabile fittizia" negli articoli indicizzati.
Le mie domande collegate topicamente:
- Questi termini sono sempre sinonimi (all'interno delle statistiche)?
- Uno di questi termini viene mai applicato in modo accettabile ad altre forme di codifica categoriale (ad es. Codifica effetto , codifica Helmert, ecc. )?
- Quali ragioni statistiche o disciplinari ci sono per preferire un termine rispetto all'altro?
sex
.
male
, dove 1 significa vero (in questo caso maschio) e 0 significa falso (in questo caso femmina). Se uso il nome della variabile, sex
dovrò cercare come ho codificato quella variabile ogni volta che torno a quel set di dati.
male
con valori1
o0
. Se esiste una variabile categoriale con più di 2 categorie che viene quindi espansa in variabili indicatore per l'appartenenza a ciascun livello, utilizzerei "variabili fittizie" per descrivere quell'insieme di variabili indicatore.