Stevens' tipologia scala non è necessariamente una certa caratteristica intrinseca delle variabili, e nemmeno si dati, ma di come trattiamo le informazioni - di quello che stiamo usando per dire .
In alcune circostanze, esattamente lo stesso valore può essere considerato rapporto, intervallo, ordinale o nominale, a seconda di ciò che stiamo facendo con esso - è una questione di quale significato diamo i valori, che può cambiare da un'analisi alla successiva. La tipologia di Stevens ha un certo valore, ma non deve essere eccessivamente prescrittiva al riguardo.
Questo problema dell'importanza della scala come significato risale almeno a Lord (1953), che offrì un esempio in cui c'erano interpretazioni sia nominali che a intervalli dello stesso insieme di numeri.
Questo punto è stato ancora più chiaramente chiarito da Velleman e Wilkinson (1993), che offrono un esempio di persone che ricevono biglietti numerati consecutivi all'ingresso di un ricevimento con un premio assegnato a uno dei biglietti; a seconda dell'uso dei numeri sui biglietti, essi hanno interpretazioni su tutte e quattro le scale.
Ad esempio, "ho vinto?" è una domanda che considera il numero come nominale, mentre "sono arrivato troppo presto per ottenere il biglietto vincente?" è una domanda che lo considera ordinale; d'altra parte (e non credo che questo sia sul giornale) usando 5 numeri di biglietti casuali per stimare il numero di persone nella stanza li tratterà come rapporto (ad esempio se ci fossero 4 numeri estratti casualmente che hanno ottenuto premi di consolazione, avresti complessivamente 5 numeri casuali da cui stimare la partecipazione totale).
Sostengono che "una buona analisi dei dati non assume tipi di dati", "le categorie di Stevens non descrivono attributi fissi di dati", "le categorie di Stevens non sono sufficienti per descrivere le scale di dati" e "le procedure statistiche non possono essere classificate secondo i criteri di Stevens" (anzi ogni affermazione è anche un titolo di sezione).
Le critiche furono anche offerte in diversi punti da Tukey (ad es. Nel capitolo 5 del libro Mosteller e Tukey del 1977 Analisi e regressione dei dati ); Mosteller e Tukey hanno offerto una tipologia:
nomi , voti (etichette ordinate), gradi
(a partire da 1, che può rappresentare il più grande o il più piccolo), frazioni conteggiate (delimitate da zero e una, comprese le percentuali), conteggi (non negativi numeri interi), importi (numeri reali non negativi), saldi (valori illimitati, positivi o negativi).
Nel mio lavoro, ho visto situazioni in cui gravi problemi con l'analisi erano causati da persone che non riuscivano ad apprezzare la grande differenza tra le variabili relative ai livelli (a volte chiamate variabili "stock") e ai flussi : un semplice esempio di questi tipi è la differenza nel tipo di analisi appropriato per le quantità di acqua effettivamente presenti in un serbatoio di stoccaggio in ciascuna sequenza di periodi e la quantità di acqua che scorre in essa. Questi (in alcuni di questi casi) sarebbero entrambi sottocategorie del tipo di " quantità " di Mosteller e Tukey (e in quegli stessi casi, entrambe le variabili di rapporto nello schema di Stevens), indicando che i problemi di tipologia possono essere abbastanza sottili, ma può ancora avere un impatto critico su analisi appropriate.
PFVelleman e L. Wilkinson (1993),
"Le tipologie nominali, ordinali, di intervallo e di rapporto sono fuorvianti",
The American Statistician , vol. 47 n. 1 pagg. 65-72
(una versione funzionante sembra essere disponibile sulla pagina Web dei 2 autori qui )
Lord, F. (1953),
"Sul trattamento statistico dei numeri di calcio",
American Psychologist , 8 , pp. 750-751
(L'anno di questo documento è riportato erroneamente nei riferimenti della versione del documento di Velleman e Wilkinson a cui ho collegato, ma a cui si fa correttamente riferimento nel corpo del documento)