Mi scuso per la macellazione del gergo statistico :) Ho trovato qui un paio di domande relative alla pubblicità e alle percentuali di clic. Ma nessuno di loro mi ha aiutato molto con la mia comprensione della mia situazione gerarchica.
C'è una domanda correlata: queste rappresentazioni equivalenti dello stesso modello gerarchico bayesiano? , ma non sono sicuro che abbiano effettivamente un problema simile. Un'altra domanda Priori per il modello binomiale bayesiano gerarchico entra nei dettagli sugli hyperpriors, ma non sono in grado di mappare la loro soluzione al mio problema
Ho un paio di annunci online per un nuovo prodotto. Ho lasciato gli annunci pubblicati per un paio di giorni. A quel punto abbastanza persone hanno fatto clic sugli annunci per vedere quale ottiene il maggior numero di clic. Dopo aver espulso tutti tranne quello che ha il maggior numero di clic, l'ho lasciato correre per un altro paio di giorni per vedere quante persone acquistano effettivamente dopo aver fatto clic sull'annuncio. A quel punto so se è stata una buona idea pubblicare gli annunci in primo luogo.
Le mie statistiche sono molto rumorose perché non ho molti dati poiché vendo solo un paio di articoli ogni giorno. Pertanto è davvero difficile stimare quante persone acquistano qualcosa dopo aver visto un annuncio. Solo uno su ogni 150 clic genera un acquisto.
In generale, devo sapere se sto perdendo denaro su ogni annuncio il più presto possibile, in qualche modo appianando le statistiche del gruppo per annuncio con le statistiche globali su tutti gli annunci.
- Se aspetto che ogni annuncio abbia visto abbastanza acquisti, andrò in rovina perché impiega troppo tempo: testando 10 annunci devo spendere 10 volte di più in modo che le statistiche per ogni annuncio siano abbastanza affidabili. A quel punto avrei potuto perdere denaro.
- Se avrò una media degli acquisti su tutti gli annunci non sarei in grado di eliminare gli annunci che non funzionano altrettanto bene.
Potrei usare il tasso di acquisto globale ( N $ sub-distribuzioni? Ciò significherebbe che più dati ho per ogni annuncio, più indipendenti sono le statistiche per quell'annuncio. Se nessuno ha ancora fatto clic su un annuncio, suppongo che la media globale sia appropriata.
Quale distribuzione sceglierei per quello?
Se ho avuto 20 clic su A e 4 clic su B, come posso modellarlo? Finora ho capito che una distribuzione binomiale o di Poisson potrebbe avere senso qui:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(stimare il tasso di acquisto solo per il gruppo A?)
Ma cosa devo fare per calcolare effettivamente il purchase_rate | group A
. Come collegare due distribuzioni insieme per avere un senso per il gruppo A (o qualsiasi altro gruppo).
Devo prima montare un modello? Ho dei dati che potrei usare per "addestrare" un modello:
- Annuncio A: 352 clic, 5 acquisti
- Annuncio B: 15 clic, 0 acquisti
- Annuncio C: 3519 clic, 130 acquisti
Sto cercando un modo per stimare la probabilità di uno qualsiasi dei gruppi. Se un gruppo ha solo un paio di punti dati, essenzialmente voglio tornare alla media globale. Conosco un po 'le statistiche bayesiane e ho letto molti PDF di persone che descrivono come modellano usando l'inferenza bayesiana e i priori coniugati e così via. Penso che ci sia un modo per farlo correttamente, ma non riesco a capire come modellarlo correttamente.
Sarei molto contento dei suggerimenti che mi aiutano a formulare il mio problema in modo bayesiano. Ciò sarebbe di grande aiuto nel trovare esempi online che potrei usare per implementarlo.
Aggiornare:
Grazie mille per aver risposto. Sto cominciando a capire sempre più piccoli dettagli sul mio problema. Grazie! Consentitemi di porre alcune domande per capire se ora capisco meglio il problema:
Quindi suppongo che le conversioni siano distribuite come distribuzioni Beta e una distribuzione Beta ha due parametri, e b .
Il 1 parametri sono iperparametri, quindi sono parametri del precedente? Quindi alla fine ho impostato il numero di conversioni e il numero di clic come parametro della mia distribuzione Beta?
Ad un certo punto quando voglio confrontare annunci diversi, quindi calcolerei . Come calcolo ogni parte di quella formula?
Penso che è chiamato probabilità, o "modalità" della distribuzione Beta. Quindi questo è α - 1
Quindi mi moltiplico con il precedente, che è P (conversione), che nel mio caso è solo il precedente di Jeffreys, che non è informativo. Il precedente rimarrà lo stesso quando avrò più dati?
Usando il precedente di Jeffreys, suppongo di iniziare da zero e di non sapere nulla dei miei dati. Quel precedente si chiama "non informativo". Mentre continuo a conoscere i miei dati, aggiorno il precedente?
Quando arrivano clic e conversioni, ho letto che devo "aggiornare" la mia distribuzione. Questo significa che cambiano i parametri della mia distribuzione o che cambiano i precedenti? Quando ricevo un clic per l'annuncio X, aggiorno più di una distribuzione? Più di un precedente?