RFM et modélisation de la valeur à vie du client dans R

12

Quelqu'un peut-il me dire comment modéliser la récence, la fréquence et la valeur monétaire (RFM) et la modélisation de la valeur client dans R?

De plus, quelqu'un peut-il me renvoyer de la littérature à ce sujet?

Bêta
la source
1
vous pouvez également consulter le package BTYD dans R. Ou acheter le package jusqu'à votre mort. Je pense que Bruce Hardie est l'un des auteurs. Pas trop sûr cependant.

Réponses:

10

En ce qui concerne les références, l' exploration de données à l'aide de l'analyse RFM devrait aider en ce qui concerne la terminologie et les autres références.

L'un des moyens les plus simples (et les plus populaires) de modéliser la probabilité de réponse des clients consiste à utiliser la régression logistique avec RFM comme variables explicatives (parmi d'autres variables disponibles).

Pour modéliser la valeur monétaire, on pourrait simplement régresser directement les revenus sur RFM (en utilisant un modèle linéaire simple pour les débutants), ce qui est généralement étonnamment bon. Les modèles plus avancés / non linéaires (tels que Random Forest ou Gradient Boosting Machine) font mieux que les modèles linéaires dans mon expérience.

Une autre approche populaire consiste à construire un modèle légèrement plus complexe pour prédire la valeur monétaire sur la base de deux sous-modèles: l'un pour la probabilité de réponse (par exemple en utilisant la régression logistique en fonction de la RFM), et l'autre pour les revenus conditionnels à la réponse (encore une fois, il pourrait être aussi simple qu'un modèle linéaire de RFM). La valeur monétaire attendue est le produit des deux prédictions.

Si des données de test / contrôle randomisées sont disponibles, alors des techniques basées sur le soulèvement / netlift sont très populaires pour modéliser les avantages incrémentiels d'un traitement.

En ce qui concerne la valeur du cycle de vie du client, voir Modélisation de la valeur à vie du client pour un examen et d'autres références.

En ce qui concerne la modélisation en R, je ne connais aucun package "standard" pour ce type de modélisation. R fournit cependant tous les blocs de construction nécessaires (sauf si vous avez une énorme quantité de données - dans ce cas, vous devrez peut-être compter sur des outils plus évolutifs)

Yevgeny
la source
1
Très belle réponse, mais je pense que le premier lien pourrait être rompu.
Dimitriy V. Masterov
@Yevgeny, j'ai deux questions concernant les suggestions que vous avez faites. Premièrement, en ce qui concerne la modélisation de la valeur monétaire, est-il acceptable de régresser les revenus en utilisant Monétaire parmi les variables prédictives? Je crains que ce ne soit la même variable. En second lieu, avez-vous des ressources en ligne qui pourraient m'aider à comprendre comment effectuer une régression linéaire conditionnelle à la réponse (en utilisant la deuxième approche que vous avez décrite)? Merci beaucoup!
nhern121
1) C'est correct tant que vous ne confondez pas les variables explicatives / d'entrée (des données passées) et la variable cible (des données "futures") 2) Choisissez simplement le sous-ensemble de données où les clients ont acheté quelque chose et régressez les revenus sur les variables explicatives
Yevgeny
5

Je ne sais pas si vous travaillez toujours sur la modélisation RFM. Voici ( pdf ) un article / la vignette du package BTYD en R qui pourrait vous être utile. L'article entier est basé sur R et il a 3 modèles différents à regarder. À la page 1, 2.1 Préparation des données, vous pouvez voir le contexte des RFM.

tranchant
la source
Merci Gung! Même si actuellement je n'y travaille pas. Mais c'est très utile. Cela pourrait également être utile à d'autres personnes qui y travaillent actuellement.
Bêta