Diciamo, abbiamo una semplice domanda "sì / no" a cui vogliamo sapere la risposta. E ci sono N persone che "votano" per una risposta corretta. Ogni elettore ha una cronologia - elenco di 1 e 0, che mostra se nel passato avevano ragione o torto su questo tipo di domande. Se assumiamo la storia come una distribuzione binomiale, possiamo trovare il rendimento medio degli elettori su tali domande, la loro variazione, CI e qualsiasi altro tipo di parametri di confidenza.
Fondamentalmente, la mia domanda è: come incorporare le informazioni sulla fiducia nel sistema di voto ?
Ad esempio, se consideriamo solo il rendimento medio di ciascun elettore, possiamo costruire un sistema di voto ponderato semplice:
Cioè, possiamo semplicemente sommare i pesi degli elettori moltiplicati per (per "sì") o per (per "no"). Ha senso: se l'elettore 1 ha una media di risposte corrette pari a e l'elettore 2 ha solo , allora, probabilmente, il voto della prima persona dovrebbe essere considerato più importante. D'altra parte, se la prima persona ha risposto solo a 10 domande di questo tipo e la seconda persona ha risposto a 1000 di queste domande, siamo molto più sicuri del livello di abilità della seconda persona che di quelli della prima - è possibile che la prima persona sia stata fortunata e dopo 10 risposte relativamente riuscite continuerà con risultati molto peggiori.
Quindi, una domanda più precisa può sembrare così: esiste una metrica statistica che incorpora sia la forza che la fiducia su alcuni parametri?