Confronto da 0/10 a 0/20


10

Quando si discute delle percentuali di raggiungimento delle attività, c'è un modo per dimostrare che 0 tentativi su 20 sono "peggiori" di 0 tentativi su 10?


1
Potresti provare a usare en.wikipedia.org/wiki/Additive_s
smoothing

Come fai a sapere che è peggio? Ad esempio, se fossero possibili solo 10 tentativi, allora non sai quale sarebbe il punteggio con più tentativi.
Tim

4
Forse un intervallo di confidenza per la proporzione stimata?
mdewey,

5
Questa mi sembra una domanda ragionevole. Si basa su un'intuizione perfettamente normale che può essere discussa e ci sono modi statistici (ad esempio Bayesian) per affrontare il problema. Sto votando per lasciare aperto.
gung - Ripristina Monica

1
Sono d'accordo con @gung. Questa è una buona domanda
Alexis,

Risposte:


3

Supponiamo che conosciamo la probabilità di successo in un tentativo. In questo caso calcoliamo la probabilità di 0 su 10 e 0 su 20 casi.

Tuttavia, in questo caso facciamo il contrario. Non conosciamo la probabilità, abbiamo i dati e proviamo a stimare la probabilità.

Più casi abbiamo, più possiamo essere certi dei risultati. Se lancerò una moneta e ne uscirà testa, non sarai certo che sia a doppia testa. Se lo lancerò 1.000 volte e saranno tutte teste, è improbabile che sia bilanciato.

Ci sono metodi che sono stati progettati per considerare il numero di piste quando si danno le stime. Uno di questi è l' additivo addolcimento del commento di @abukaj sopra. Nel livellamento additivo aggiungiamo ulteriori pseudo campioni in considerazione. Nel nostro caso, invece della traccia che abbiamo visto, ne aggiungiamo altri due: uno di successo e uno di successo.

  • 1+010+1+1112
  • 1+020+1+1122

Si noti che il livellamento additivo è solo un metodo di stima. Otterrai risultati diversi con metodi diversi. Anche con il livellamento additivo stesso, si otterrebbero risultati diversi se si aggiungessero 4 pseudo campioni.

1n2

La media in entrambi i casi è 0. Prendiamo un livello di confidenza del 90% (z = 1.645)

  • 1.64510
  • 1.64520

In caso di dati mancanti, c'è incertezza. Le ipotesi che fai e i dati esterni che utilizzerai cambieranno ciò che otterrai.


1
Grazie mille Dan Levin. La tua risposta fu abbastanza chiara da poter essere seguita da un non matematico, e tuttavia abbastanza solida da consentirmi di accettare intuitivamente la tua spiegazione. Grazie a tutti i commentatori per il vostro contributo.
vinne,

1

Estendendo l'idea di invocare intervalli di confidenza, esiste un concetto di intervallo binomiale esatto.

pq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

p

p

pn,0=(1p)n

pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10


0

Un approccio bayesiano

  • Xii=1,np
  • p αβ

La funzione di probabilità è Bernoulli e la distribuzione Beta è un coniugato precedente alla distribuzione di Bernoulli, quindi il posteriore segue la distribuzione Beta. Inoltre, il posteriore è parametrizzato da:

α^=α+i=1nXiβ^=β+ni=1nXi

Di conseguenza:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

pαα+β+10pαα+β+20p

p

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.