Ho alcuni dati interessanti sugli artisti musicali più popolari trasmessi in streaming divisi per posizione in circa 200 distretti congressuali. Voglio vedere se è possibile sondare una persona sulle sue preferenze musicali e determinare se "ascolta come un democratico" o "ascolta come un repubblicano". (Naturalmente questo è leggero, ma c'è una vera entropia nei dati!)
Ho dati su circa 100 artisti, oltre alla percentuale media di voti per repubblicani e democratici in ciascun distretto negli ultimi tre cicli elettorali. Quindi ho eseguito una correlazione su ciascun artista per vedere quali erano ascoltati in modo sproporzionato in funzione della quota di voto per i democratici. Tali correlazioni vanno da circa -0,3 a 0,3 per un dato artista, con abbondanza nel mezzo che hanno poco o nessun potere predittivo.
Ho due domande: in primo luogo, il numero complessivo di flussi per distretto varia notevolmente. In questo momento, sto correlando la percentuale di tutti i flussi per distretto appartenenti, per esempio, a Beyonce, con la percentuale di voti espressi per i democratici. Ma i flussi totali in un distretto potrebbero essere in milioni, mentre un altro è in basso 100.000. Devo ponderare la correlazione in qualche modo per spiegare questo?
In secondo luogo, sono curioso di sapere come combinare queste correlazioni in un'ipotesi composita sulla politica dell'utente. Diciamo che prendo i 20 artisti con i più alti valori correlativi assoluti (positivi e negativi), dieci in ciascuna direzione, e scruto un utente su quanto gli piaccia ogni artista. Quindi ho voti positivi o negativi su ciascun artista e la correlazione con la politica per tutti i 20 valori. Esiste un modo standard per combinare queste correlazioni in un'unica stima? (Sto pensando a qualcosa come il famoso quiz dialettale di New York , in cui ha combinato le probabilità regionali per 25 domande in una mappa di calore. Ma in questo caso, ho solo bisogno di un singolo valore su quanto sia democratico o repubblicano il gusto della musica.
Grazie!