Come modellare il comportamento di acquisto dell'utente su Amazon?


9

Per il nostro progetto del corso finale in Data Science, abbiamo proposto quanto segue-

Dai il set di dati di Amazon Reviews , prevediamo di elaborare un algoritmo (basato approssimativamente sul PageRank personalizzato) che determina una posizione strategica per la pubblicazione di annunci su Amazon. Ad esempio, ci sono milioni di prodotti su Amazon. E il set di dati ti dà un'idea di quali prodotti sono correlati, quali prodotti sono stati riuniti, visualizzati insieme ecc. (Possiamo costruire un grafico con queste informazioni anche visualizzate e anche acquistate) Ti dà anche le recensioni associate a ciascun prodotto 14 anni. Utilizzando tutte queste informazioni, valuteremo / classificheremo i prodotti su Amazon. Ora sei un fornitore su Amazon che desidera migliorare il traffico verso la sua pagina di prodotto. Il nostro algoritmo ti aiuta a identificare le posizioni strategiche nel grafico in cui puoi posizionare il tuo annuncio in modo da ottenere il massimo traffico.

Ora, la domanda del nostro professore è: come convaliderai il tuo algoritmo senza utenti reali? Abbiamo detto-

Possiamo modellare un set fisso di utenti. Alcuni utenti seguono also_boughte si also_viewedcollegano al terzo hop più spesso del primo o del quinto hop. Lì il comportamento degli utenti è normalmente distribuito. Alcuni altri utenti difficilmente navigano oltre il primo hop. Questo insieme di comportamenti degli utenti è distribuito esponenzialmente.

Il nostro professore ha detto: qualunque sia la distribuzione seguita dagli utenti, gli utenti navigano utilizzando i collegamenti per prodotti simili. Il tuo algoritmo di classificazione considera anche la somiglianza tra i prodotti 2 per classificare i prodotti. Quindi usare questo algoritmo di validazione è un po ' cheating. Vieni con qualche altro comportamento dell'utente, qualcosa di più realistico e ortogonale all'algoritmo.

Qualche idea su come modellare il comportamento degli utenti? Sono felice di fornire maggiori dettagli sull'algo.

Risposte:


1

Come validerai il tuo algoritmo?

Invece di provare a rispondere alla seconda domanda, considera che la tua risposta alla prima domanda potrebbe richiedere una revisione ...

Quali metodi hai utilizzato per convalidare i metodi di apprendimento durante la tua lezione di scienza dei dati? Innanzitutto, devi definire un set specifico di metriche numeriche per valutare il successo o il fallimento del tuo modello. In secondo luogo, quali metodi è possibile utilizzare per creare una popolazione di test molto realistica (più realistica della modellizzazione della popolazione)? Il primo suggerimento che darò è che il set di dati Amazon Reviews è molto grande, quindi i tuoi dati sono molto modificabili con questo metodo. Il secondo suggerimento che darò è che questo metodo è probabilmente quello che hai usato nel 95% dei problemi di apprendimento supervisionato su cui hai lavorato in classe ...

Spero che questo aiuti ... Modificherò questo, se necessario, basandomi sui commenti aggiunti dall'OP, ma non voglio fornire la soluzione immediatamente al fine di suscitare un pensiero organico, ad esempio poiché si tratta di un problema di classe e il Prof cercando anche di aiutarti a trovare la soluzione giusta da solo.


0

Ci sono due requisiti per il modello di comportamento che dovresti usare: (1) "più realistico" e (2) ortogonale al tuo algoritmo.

(1) In termini realistici, supponiamo che ciò significhi che il comportamento dovrebbe riflettere comportamenti osservati in contesti diversi e più ampi rispetto al contesto specifico degli acquisti di Amazon.

(2) L'ortogonale è più semplice da capire. Il comportamento modellato non dovrebbe essere guidato da somiglianze tra prodotti.

Un approccio semplice per soddisfare questi due requisiti deriverebbe dal fatto che i comportamenti di acquisto sono guidati da caratteristiche socio-demografiche come sesso, età, posizione (ad es. Area urbana / rurale) e vincoli economici (reddito e prezzo).

Hai un set di utenti e un set di prodotti. È possibile stimare la relazione tra le variabili socio-demografiche e la domanda di prodotto utilizzando tecniche di regressione semplici ma accurate. Se necessario, è possibile utilizzare fonti esterne di dati per formulare ipotesi relative a importanti variabili mancanti come il reddito.

Quindi, se sei un fornitore, il modello socio-demografico prevederebbe quali gruppi hanno maggiori probabilità di acquistare il tuo prodotto.

Spero che aiuti :)

Ben

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.