Tecniche di data mining nella campagna di Obama


10

Mi sono imbattuto in questo articolo sulla squadra di data mining nella campagna di rielezione di Obama. Sfortunatamente, l'articolo è molto confuso sull'attuale meccanismo degli algoritmi statistici. Tuttavia, sembrava che le tecniche generali fossero note nelle scienze sociali e politiche. Dal momento che questa non è la mia area di competenza, qualcuno può indicarmi la letteratura (panoramica) su questo tipo di tecniche?

Risposte:


16

Quell'area si chiama microtargeting (se desideri Google per esso). Le campagne sono piuttosto reticente sui loro strumenti e procedure, in modo che io sappia, non c'è che molto ha pubblicato il lavoro ad eccezione di Hal Malchow Targeting politico (2008) o Green & Gerber (2008) Uscire the Vote: Come aumentare l'affluenza alle urne (queste ultime offerte più con aspetti di scienze sociali come quali annunci sono efficaci e simili).

Su questioni più tecniche la letteratura è ancora più scarsa, ma vedi, ad esempio, Murray & Scime (2010) , il documento di Analisi politica di Imai & Strauss (2011) ( postprint ) o il recente documento Annals of Applied Statistics di noi Rusch, Lee, Hornik, Jank & Zeileis (2013) ( postprint ). Ciò che tutti hanno in comune è che fanno uso di tecniche di data mining, principalmente basate su alberi.

Murray & Scime usano alberi di classificazione standard come CART.

Rusch et al. utilizzare alberi di classificazione, modelli logistici e un ibrido di alberi e regressione logistica. Usano anche (tra gli altri) foreste casuali, reti neurali, macchine vettoriali di supporto e alberi di regressione additiva bayesiana per confrontare con i loro ibridi di alberi, come è descritto nella controreplica al documento . I loro alberi ibridi hanno funzionato alla pari con quegli altri metodi nei loro set di dati e offrono una maggiore interpretabilità (condividiamo anche il loro codice e dati).

Imai & Strauss è interessante in quanto presentano un quadro teorico decisionale completo per una pianificazione ottimale della campagna, non solo strumenti per il microtargeting come fanno gli altri. Pertanto si stanno concentrando molto sugli aspetti della ricerca operativa su come ottenere il massimo da ogni dollaro investito in una campagna. Nell'aspetto del loro quadro in cui impiegano tecniche statistiche per il microtargeting e la stima dell'affluenza, si affidano nuovamente agli alberi di classificazione.

Quindi, sembra esserci un certo consenso sul fatto che l'uso di metodi basati su alberi funzioni bene in questo settore.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.