Il risultato di un esame è un binomio?


31

Ecco una semplice domanda statistica che mi è stata data. Non sono proprio sicuro di capirlo.

X = il numero di punti acquisiti in un esame (scelta multipla e una risposta corretta è un punto). Il binomio X è distribuito?

La risposta del professore fu:

Sì, perché ci sono solo risposte giuste o sbagliate.

La mia risposta:

No, perché ogni domanda ha una diversa "probabilità di successo" p. Come ho capito, una distribuzione binomiale è solo una serie di esperimenti di Bernoulli, che hanno ciascuno un risultato semplice (successo o fallimento) con una data probabilità di successo p (e tutti sono "identici" rispetto a p). Ad esempio, lanciando una moneta (fiera) 100 volte, si tratta di 100 esperimenti di Bernoulli e tutti hanno p = 0,5. Ma qui le domande hanno diversi tipi di p giusto?


14
+1 Ancora di più al punto: a meno che questo non sia davvero uno strano esame, le risposte alle domande saranno fortemente correlate. Se è il punteggio totale per un individuo, questo precluderà una distribuzione binomiale. Potrebbe essere possibile che la domanda operi in base a un'ipotesi di "ipotesi nulla" in cui tutti gli esaminatori indovinano in modo indipendente e casuale tutte le risposte? X
whuber

2
Che paradossale, almeno avrei fatto pressioni per un merito parziale su questo, ma la "risposta" sembra riflettere una disinclinazione nel premiarlo :) (Penso che tu sia proprio qui).
AdamO,

1
Sì, grazie: D, penso che sia più una distribuzione binomiale di Poisson (se non altro)
Paul


2
Concordo con tutti sul fatto che la domanda fosse scarsa, ma qui c'è un problema di inquadratura. Se questo è un corso elementare ed è un formato a risposta breve (in modo che tu abbia la possibilità di spiegare il tuo ragionamento), direi che la risposta migliore è probabilmente "sì (assumendo indipendenza e pari difficoltà per ogni domanda)"; ciò significherebbe al professore che (1) capisci i limiti della domanda e (2) non stai cercando di essere un coglione.
Ben Bolker,

Risposte:


25

Sono d'accordo con la tua risposta. Di solito questo tipo di dati verrebbe modellato al giorno d'oggi con un qualche tipo di modello di teoria della risposta agli oggetti . Ad esempio, se si utilizzava il modello Rasch , la risposta binaria verrebbe modellata comeXni

Pr{Xni=1}=eβnδi1+eβnδi

dove può essere pensato come persone -esimo capacità e come -esimo difficoltà domanda. Quindi il modello consente di cogliere il fatto che persone diverse variano nelle capacità e le domande variano in difficoltà, e questo è il più semplice dei modelli IRT.βnnδii

Il tuo professori risposta presuppone che tutte le domande hanno lo stesso probabilità di "successo" e sono indipendenti, poiché binomiale è una distribuzione di una somma di IID prove di Bernoulli. Ignora i due tipi di dipendenze sopra descritti.n

Come notato nei commenti, se hai esaminato la distribuzione delle risposte di una determinata persona (quindi non devi preoccuparti della variabilità inter-persona) o le risposte di persone diverse sullo stesso elemento (quindi non c'è tra- variabilità dell'oggetto), quindi la distribuzione sarebbe Poisson-binomiale, ovvero la distribuzione della somma di prove di Bernoulli non iid. La distribuzione potrebbe essere approssimata con binomiale o Poisson, ma questo è tutto. Altrimenti stai assumendo l'ipotesi IID.n

Anche in base a un'ipotesi "nulla" sull'ipotesi, ciò presuppone che non vi siano modelli di indovinazione, quindi le persone non differiscono nel modo in cui indovinano e gli oggetti non differiscono nel modo in cui vengono indovinati - quindi l'indovinatura è puramente casuale.


Ciò ha senso! Anche se immagino che potresti calcolare la probabilità della probabilità di successo di una domanda, ma l'abilità delle persone sembra difficile :) Un'altra idea che ho avuto è quella di modellare questo come una somma di distribuzioni di bernulli? Ad esempio, supponiamo che ci siano 2 domande, quindi 2 probabilità di successo p1 e p2. Analogamente due conteggio delle variabili X1 e X2 (quindi 2 esperimenti di bernulli). Quindi ad esempio la probabilità di ottenere un punteggio totale di 1 è P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) p2. Sembra ragionevole?
Paul,

2
@Paul somma di due Bernoulli con diverse p è Poisson-binomiale
Tim

4
L'ipotesi "nulla" è fondamentalmente una cosa della mucca sferica, puoi sempre cavillare su quanto sia sferica la mucca.
Hong Ooi,

5

La risposta a questo problema dipende dall'inquadramento della domanda e dal momento in cui vengono acquisite le informazioni. Nel complesso, tendo ad essere d'accordo con il professore, ma penso che la spiegazione della sua risposta sia scarsa e la domanda del professore dovrebbe includere più informazioni in anticipo.

Se consideri un numero infinito di potenziali domande d'esame e ne disegni una a caso per la domanda 1, disegna una a caso per la domanda 2, ecc. Quindi vai all'esame:

  1. Ogni domanda ha due risultati (giusto o sbagliato)
  2. Esiste un numero fisso di prove (domande)
  3. Ogni prova potrebbe essere considerata indipendente (andando nella domanda due, la tua probabilità di farlo bene è la stessa di quando vai nella domanda uno)p

In questo quadro, i presupposti di un esperimento binomiale sono soddisfatti.

Purtroppo, i problemi statistici proposti male sono molto comuni nella pratica, non solo negli esami. Non esiterei a difendere la tua logica dal tuo professore.


Sì, immagino che sia giusto. La domanda è "cattiva", dal momento che si potrebbe discutere in entrambi i modi, dato che vengono fornite così poche informazioni. Ma ero solo molto scontento della risposta data dal mio professore.
Paul,

4
@Paul, in realtà è abbastanza difficile scrivere buone domande statistiche. So di averlo segnalato in molte occasioni.
gung - Ripristina Monica

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Penso che dovresti rendere esplicito il presupposto che le domande d'esame sono tratte indipendentemente dal pool di potenziali domande. Sarebbe più realistico per loro essere correlati: se la domanda 1 è facile, è probabile che ti venga dato un esame facile e che la domanda 2 sarà facile.
Adrian,

0

Se ci sono n domande, e posso rispondere a una qualsiasi domanda correttamente con probabilità p, e c'è abbastanza tempo per provare a rispondere a tutte le domande, e ho fatto 100 di questi test, quindi i miei punteggi sarebbero distribuiti normalmente con una media di np.

Ma non sono io a ripetere il test 100 volte, sono 100 candidati diversi che fanno un test, ognuno con la propria probabilità p. La distribuzione di questi p sarà il fattore principale. Potresti avere un test in cui p = 0.9 se hai studiato bene la materia, p = 0.1 se non l'hai fatto, con pochissime persone tra 0,1 e 0,9. La distribuzione dei punti avrà massimi molto forti a 0,1 n e 0,9 n e non si troverà da nessuna parte vicino alla distribuzione normale.

D'altra parte, ci sono test in cui tutti possono rispondere a qualsiasi domanda, ma impiegano diverse quantità di tempo, quindi alcuni risponderanno a tutte le n domande e altri risponderanno meno perché restano senza tempo. Se possiamo presumere che la velocità dei candidati sia distribuita normalmente, i punti saranno vicini alla distribuzione normale.

Ma molti test conterranno alcune domande molto difficili e alcune molto facili, intenzionalmente in modo da poter distinguere tra i migliori candidati (che risponderanno a tutte le domande fino a un certo grado di difficoltà) e i peggiori candidati (che saranno in grado di rispondere solo molto domande semplici). Ciò cambierebbe abbastanza fortemente la distribuzione dei punti.


2
La distribuzione normale che descrivi qui è la normale approssimazione del binomio. Ovviamente la somma degli zeri e di quelli non sarebbe continua e si collocherebbe tra e
Tim

2
@Tim Nonostante la dipendenza superflua dalle normali distribuzioni e il mistero di fare 100 test, questa risposta ha il merito di tentare di dimostrare come un caso particolare possa portare a una distribuzione ovviamente non binomiale. In quanto tale, potrebbe essere un valido contributo alle risposte se questi problemi tecnici fossero affrontati.
whuber

0

Per definizione, una distribuzione binomiale è un insieme di processi di Bernoulli indipendenti e identicamente distribuiti . Nel caso di un esame a scelta multipla, ciascuna delle domande sarebbe una delle prove di Bernoulli.n n

Il problema qui sorge perché non possiamo ragionevolmente presumere che le domande:n

  • Sono distribuiti in modo identico . Come hai detto, la probabilità che uno studente conosca la risposta alla domanda non sarà quasi certamente uguale alla probabilità che conoscano la domanda e così via.12
  • Sono indipendenti . Molti esami pongono domande che si basano sulle risposte alle domande precedenti. Chi può dire con certezza che ciò non accadrà nell'esame in questa domanda? Ci sono altri fattori che potrebbero fornire risposte a domande d'esame non indipendenti l'una dall'altra, ma penso che questa sia la più intuitivamente ovvia.

Ho visto le domande nelle classi di Statistica che modellano le domande d'esame come binomiali, ma sono inquadrate in modo simile a:

Quale distribuzione di probabilità modellerebbe il numero di domande a cui rispondere correttamente in un esame a scelta multipla in cui ogni domanda ha quattro scelte e lo studente che sta sostenendo l'esame sta indovinando ogni risposta a caso?

In questo scenario, ovviamente sarebbe rappresentato come una distribuzione binomiale con .p=14


Non c'è nulla di importante nei tuoi fatti, ma la logica non è corretta: non è sufficiente dimostrare che alcuni presupposti potrebbero non essere validi, perché (logicamente) la distribuzione potrebbe comunque essere binomiale in ogni caso. È inoltre necessario dimostrare che questi presupposti possono fallire in modi che rendono la distribuzione del punteggio decisamente non binomiale.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.