RFM e modellazione del valore della durata del cliente in R


12

Qualcuno può dirmi come fare la modellazione di recency, frequenza e valore monetario (RFM) e modellazione del valore del cliente in R?

Inoltre, qualcuno può riferirmi della letteratura su di esso?


1
puoi anche guardare il pacchetto BTYD in R. O comprare fino alla morte del pacchetto. Penso che Bruce Hardie sia uno degli autori. Non troppo sicuro però.

Risposte:


10

Per quanto riguarda i riferimenti, l' estrazione dei dati mediante l'analisi RFM dovrebbe aiutare per quanto riguarda la terminologia e ulteriori riferimenti.

Uno dei modi più semplici (e popolari) per modellare la probabilità di risposta del cliente è utilizzare la regressione logistica con RFM come variabili esplicative (tra le altre variabili disponibili).

Per modellare il valore monetario, si potrebbe semplicemente regredire direttamente le entrate sulla RFM (usando un semplice modello lineare per i principianti) che di solito fa sorprendentemente bene. I miei modelli più avanzati / non lineari (come Random Forest o Gradient Boosting Machine) fanno meglio dei modelli lineari nella mia esperienza.

Un altro approccio popolare è quello di costruire un modello leggermente più complesso per la previsione del valore monetario basato su due sotto-modelli: uno per la probabilità di risposta (ad esempio utilizzando la regressione logistica come funzione di RFM) e l'altro per le entrate condizionate alla risposta (di nuovo, potrebbe essere semplice come un modello lineare di RFM). Il valore monetario atteso è il prodotto delle due previsioni.

Se sono disponibili dati di test / controllo randomizzati, le tecniche basate su uplift / netlift sono abbastanza popolari per modellare il beneficio incrementale di un trattamento.

Per quanto riguarda il valore del ciclo di vita del cliente, vedere Modellazione del valore della vita del cliente per una revisione e ulteriori riferimenti.

Per quanto riguarda la modellazione in R, non sono a conoscenza di pacchetti "pronti all'uso" per quel tipo di modellazione. R fornisce comunque tutti i mattoni necessari (a meno che non si disponga di un'enorme quantità di dati, in tal caso potrebbe essere necessario fare affidamento su strumenti più scalabili)


1
Risposta molto bella, ma penso che il primo link potrebbe essere interrotto.
Dimitriy V. Masterov

@Yevgeny, ho due domande sui suggerimenti che hai dato. In primo luogo, per quanto riguarda la modellizzazione del valore monetario, è corretto regredire le entrate utilizzando Monetary tra le variabili predittive? Temo che saranno quasi la stessa variabile. In secondo luogo, disponi di risorse online che potrebbero aiutarmi a capire come eseguire la regressione lineare in base alla risposta (utilizzando il secondo approccio che hai descritto)? Grazie mille!
n1212,

1) Va bene purché non si confondano le variabili esplicative / di input (dai dati passati) e la variabile target (dai dati "futuri") 2) Basta scegliere il sottoinsieme di dati in cui i clienti hanno acquistato qualcosa e regredire le entrate su le variabili esplicative
Evgenij

5

Non sono sicuro se stai ancora lavorando sulla modellazione RFM. Qui ( pdf ) è un articolo / la vignetta per il pacchetto BTYD in R che potrebbe esserti utile. L'intero articolo si basa su R e ha 3 diversi modelli da guardare. A pagina 1, 2.1 Preparazione dei dati, è possibile vedere il contesto delle RFM.


Grazie Gung! Anche se al momento non ci sto lavorando. Ma questo è molto utile. Inoltre, potrebbe essere utile per altre persone che ci stanno lavorando adesso.
Beta
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.