I punteggi dei test seguono davvero una distribuzione normale?


13

Ho cercato di scoprire quali distribuzioni usare nei GLM e sono un po 'confuso su quando usare la distribuzione normale. In una parte del mio libro di testo, si dice che una distribuzione normale potrebbe essere utile per modellare i punteggi degli esami. Nella parte successiva, si chiede quale distribuzione sarebbe appropriata per modellare un reclamo di assicurazione auto. Questa volta, ha detto che le distribuzioni appropriate sarebbero Gamma o Inverse Gaussian perché sono continue con solo valori positivi. Bene, credo che anche i punteggi degli esami sarebbero continui con solo valori positivi, quindi perché dovremmo usare una distribuzione normale lì? La distribuzione normale non consente valori negativi?


1
Se sei preoccupato per i limiti dei punteggi, potresti provare en.wikipedia.org/wiki/Truncated_normal_distribution
JG

5
Nel mondo reale, ovviamente, le distribuzioni dei punteggi degli esami spesso non assomigliano comunque a una normale distribuzione. Come esempio dei miei anni di laurea in matematica, ricordo che la classe di Topologia I era nota per la sua distribuzione di grado "bimbbell curve" altamente bimodale: o hai capito i concetti chiave e hai ottenuto un punteggio quasi perfetto, oppure no fortunato a ottenere punti. Pochissime persone hanno finito per segnare in qualsiasi punto nel mezzo tra quei due estremi.
Ilmari Karonen,

2
No. La prossima domanda.
Carl Witthoft,

Risposte:


14

L'altezza, ad esempio, è spesso modellata come normale. Forse l'altezza degli uomini è qualcosa come 5 piedi 10 con una deviazione standard di 2 pollici. Sappiamo che l'altezza negativa non è fisica, ma secondo questo modello, la probabilità di osservare un'altezza negativa è essenzialmente zero. Usiamo comunque il modello perché è un'approssimazione abbastanza buona.

Tutti i modelli sono sbagliati. La domanda è "può ancora essere utile questo modello", e nei casi in cui stiamo modellando cose come altezza e punteggi dei test, modellare il fenomeno come normale è utile nonostante tecnicamente consenta cose non fisiche.


In questo caso particolare, è discutibile se la distribuzione normale sia anche un'approssimazione utile . Quasi ogni distribuzione di grado che ho visto assomigliava in qualche modo alla curva bimodale di Ilmari Karonen menzionata nei commenti. (Anche se di solito con modalità intorno a 0.6 e 0.9, piuttosto che alle estremità estreme) Tuttavia, una combinazione lineare di due distribuzioni normali con mezzi diversi non sarebbe una cattiva approssimazione.
Ray,

Non stavo sostenendo che il normale sia LA MIGLIORE approssimazione. L'intero punto del mio commento è davvero fatto in quell'ultimo paragrafo. I commenti sulla bimodalità delle distribuzioni effettive di grado, almeno a questo livello di astrazione, non sono davvero utili.
Demetri Pananos,

Sono d'accordo con tutto ciò che hai detto nella tua risposta, ma parte della domanda riguarda se la distribuzione normale è specificamente applicabile alle distribuzioni di modelli. E la risposta è di solito "No". Tutti i modelli sono sbagliati e alcuni sono utili, ma alcuni sono più sbagliati e meno utili di altri. Il fatto che la distribuzione normale in particolare sia particolarmente inadatta a questo problema è importante e la risposta così com'è sembra suggerire che il normale è sbagliato solo perché le code diventano negative e infinite, quando in realtà ci sono problemi molto più profondi.
Ray,

Sei un po 'pedante qui. Il problema di OP era che il normale consente punteggi negativi. La bimodalità non era il problema. Non stai vedendo la foresta per gli alberi rispetto a questa domanda. I dettagli della modellazione non sono rilevanti al momento.
Demetri Pananos,

10

La distribuzione normale non consente valori negativi?

Corretta. Inoltre non ha limiti superiori.

In una parte del mio libro di testo, si dice che una distribuzione normale potrebbe essere utile per modellare i punteggi degli esami.

Nonostante le precedenti dichiarazioni, ciò è talvolta vero. Se hai molti componenti da testare, non troppo legati (ad esempio, non sei essenzialmente la stessa domanda una dozzina di volte, né hai ciascuna parte che richiede una risposta corretta alla parte precedente) e non molto facile o molto difficile ( in modo che la maggior parte dei segni si trovi da qualche parte vicino al centro), quindi i segni possono spesso essere ragionevolmente ben approssimati da una distribuzione normale; spesso abbastanza bene che le analisi tipiche dovrebbero causare poca preoccupazione.

Sappiamo per certo che non sono normali , ma questo non è automaticamente un problema - purché il comportamento delle procedure che utilizziamo sia abbastanza vicino a quello che dovrebbero essere per i nostri scopi (ad esempio errori standard, intervalli di confidenza, livelli di significatività e potere - qualunque sia necessario - fate vicino a ciò che ci aspettiamo)

Nella parte successiva, si chiede quale distribuzione sarebbe appropriata per modellare un reclamo di assicurazione auto. Questa volta, ha detto che le distribuzioni appropriate sarebbero Gamma o Inverse Gaussian perché sono continue con solo valori positivi.

Sì, ma più di questo: tendono ad essere fortemente distorti e la variabilità tende ad aumentare quando la media aumenta.

Ecco un esempio di distribuzione delle dimensioni delle attestazioni per le affermazioni sui veicoli:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Fig. 5 di Garrido, Genest & Schulz (2016) "Modelli lineari generalizzati per frequenza dipendente e gravità dei crediti assicurativi", Assicurazione: matematica ed economia, Vol 70, sett., P205-215. Https : //www.sciencedirect. com / science / article / pii / S0167668715303358 )

Ciò mostra una tipica inclinazione a destra e una coda destra pesante. Tuttavia, dobbiamo stare molto attenti perché si tratta di una distribuzione marginale e stiamo scrivendo un modello per la distribuzione condizionale , che in genere sarà molto meno inclinata (la distribuzione marginale che osserviamo se facciamo solo un istogramma di dimensioni di rivendicazione è una miscela di queste distribuzioni condizionate). Tuttavia è in genere il caso che se osserviamo la dimensione della richiesta in sottogruppi dei predittori (forse categorizzando variabili continue) che la distribuzione è ancora fortemente distorta e con una coda piuttosto pesante a destra, suggerendo che qualcosa come un modello gamma * è probabilmente sarà molto più adatto di un modello gaussiano.

* potrebbe esserci un numero qualsiasi di altre distribuzioni che sarebbero più adatte di un gaussiano - il gaussiano inverso è un'altra scelta - sebbene meno comune; modelli lognormali o Weibull, sebbene non GLM così come sono, possono anche essere molto utili.

[È raro che una di queste distribuzioni sia una descrizione quasi perfetta; sono approssimazioni inesatte, ma in molti casi sufficientemente buone da rendere l'analisi utile e vicina alle proprietà desiderate.]

Bene, credo che anche i punteggi degli esami sarebbero continui con solo valori positivi, quindi perché dovremmo usare una distribuzione normale lì?

Perché (nelle condizioni che ho menzionato prima - molti componenti, non troppo dipendenti, non difficili o facili) la distribuzione tende ad essere abbastanza vicina a simmetrica, unimodale e non pesante.


0

I punteggi degli esami potrebbero essere meglio modellati da una distribuzione binomiale. In un caso altamente semplificato, potresti avere 100 domande vere / false ciascuna del valore di 1 punto, quindi il punteggio sarebbe un numero intero compreso tra 0 e 100. Se non assumi alcuna correlazione tra la correttezza del tiratore da un problema all'altro (ipotesi dubbia però ), il punteggio è una somma di variabili casuali indipendenti e si applica il Teorema del limite centrale. All'aumentare del numero di domande, la frazione dei problemi corretti converge in una distribuzione normale.

Fai una buona domanda sui valori inferiori a 0. Puoi anche porre la stessa domanda sui valori maggiori del 100%. All'aumentare del numero di domande del test, la varianza della somma diminuisce, quindi il picco viene tirato verso la media. Allo stesso modo, la distribuzione normale più adatta avrà una varianza minore e il peso del pdf al di fuori dell'intervallo [0, 1] tende verso 0, anche se sarà sempre diverso da zero. Anche lo spazio tra i possibili valori di "frazione corretta" diminuirà (1/100 per 100 domande, 1/1000 per 1000 domande, ecc.), Quindi in modo informale, il pdf inizia a comportarsi sempre più come un pdf continuo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.