Est-il possible de comprendre conceptuellement le modèle pareto / nbd?

12

J'apprends à utiliser le package BTYD qui utilise le modèle Pareto / NBD pour prédire quand un client devrait revenir. Cependant, toute la littérature sur ce modèle est pleine de mathématiques et il ne semble pas y avoir d'explication simple / conceptuelle du fonctionnement de ce modèle. Est-il possible de comprendre le modèle Pareto / NBD pour les non-mathématiciens? J'ai parcouru ce fameux article de Fader . Le modèle Pareto / NBD fait les hypothèses suivantes:

je. Lorsqu'il est actif, le nombre de transactions effectuées par un client dans une période de temps t est réparti Poisson avec le taux de transaction λ.

ii. L'hétérogénéité des taux de transaction entre les clients suit une distribution gamma avec le paramètre de forme r et le paramètre d'échelle α.

iii. Chaque client a une «durée de vie» non observée de longueur τ. Ce point auquel le client devient inactif est distribué de façon exponentielle avec un taux de décrochage µ.

iv) L'hétérogénéité des taux d'abandon entre les clients suit une distribution gamma avec le paramètre de forme s et le paramètre d'échelle β.

v. Le taux de transaction λ et le taux d'abandon µ varient indépendamment d'un client à l'autre. "

Je ne comprends pas la (intuition derrière) la justification des hypothèses (ii), (iii) et (iv). Pourquoi seulement ces distributions, pourquoi pas les autres?

Les hypothèses du modèle BG / NBD sont également:

i.) Lorsqu'il est actif, le nombre de transactions effectuées par un client suit un processus de Poisson avec le taux de transaction λ. Cela revient à supposer que le temps entre les transactions est distribué de façon exponentielle avec le taux de transaction λ

ii) L'hétérogénéité de λ suit une distribution gamma

iii) Après toute transaction, un client devient inactif avec probabilité p. Par conséquent, le point auquel le client «abandonne» est réparti entre les transactions selon une distribution géométrique (décalée) avec pmf

iv) L'hétérogénéité de p suit une distribution bêta

La rationalité (intuitive) des hypothèses (ii), (iii) et (iv) n'est également pas du tout évidente.

Je serai reconnaissant pour toute aide. Merci.

user3282777
la source
Pourriez-vous ajouter une référence à la littérature que vous trouvez difficile?
kjetil b halvorsen
J'ai expliqué où les choses n'étaient pas claires. Je sais que ce n'est pas facile de faire jouer l'intuition mais si c'était possible, cela serait d'une grande aide. Merci.
user3282777

Réponses:

14

Imaginez que vous êtes le nouveau directeur d'un magasin de fleurs. Vous avez un dossier des clients de l'année dernière - la fréquence à laquelle ils font leurs achats et combien de temps depuis leur dernière visite. Vous voulez savoir combien d'affaires les clients listés sont susceptibles d'apporter cette année. Il y a quelques points à considérer:

[hypothèse (ii)] Les clients ont des habitudes d'achat différentes.

λλ

La distribution doit avoir peu de paramètres (vous n'avez pas forcément beaucoup de données), être assez flexible (vous n'êtes probablement pas un gourou de l'esprit d'entreprise et vous ne savez pas tout sur les habitudes d'achat), et prendre valeurs dans les nombres réels positifs. La distribution Gamma coche toutes ces cases, et est bien étudiée et relativement facile à travailler. Il est souvent utilisé comme a priori pour les paramètres positifs dans différents paramètres.

[hypothèse (iii)] Vous avez peut-être déjà perdu certains des clients de la liste.

Si Andrea a acheté des fleurs environ une fois par mois chaque mois au cours de la dernière année, il y a fort à parier qu'elle reviendra cette année. Si Ben achetait des fleurs chaque semaine, mais qu'il n'est pas là depuis des mois, il a peut-être trouvé un autre fleuriste. Lors de l'élaboration de futurs plans d'affaires, vous voudrez peut-être compter sur Andrea mais pas sur Ben.

Les clients ne vous diront pas quand ils sont passés, c'est là que l'hypothèse de «durée de vie non observée» entre en jeu pour les deux modèles. Imaginez un troisième client, Cary. Les modèles Pareto / NBD et BG / NBD vous donnent deux façons différentes de penser à Cary qui abandonne définitivement la boutique.

Pour le cas Pareto / NBD, imaginez qu'à tout moment, il y a une petite chance que Cary trouve un meilleur magasin que le vôtre. Ce risque infinitésimal constant vous donne la durée de vie exponentielle - et plus il est long depuis la dernière visite de Cary, plus il a été exposé à d'autres (potentiellement meilleurs) fleuristes.

Le cas BG / NBD est un peu plus artificiel. Chaque fois que Cary arrive dans votre boutique, il s'engage à acheter des fleurs. Lors de sa navigation, il considérera les changements de prix, de qualité et de variété depuis sa dernière visite, ce qui lui fera finalement décider de revenir la prochaine fois ou de chercher une autre boutique. Ainsi, plutôt que d'être constamment à risque, Cary a une certaine probabilité p de simplement décider de partir après chaque achat.

[hypothèse (iv)] Tous les clients ne sont pas également engagés envers votre boutique.

Certains clients sont des habitués, et seule la mort - ou une forte augmentation des prix - les forcera à partir. D'autres pourraient aimer explorer et seraient heureux de vous quitter pour le plaisir du nouveau magasin de fleurs hipster de l'autre côté de la rue. Plutôt qu'un taux d'abandon unique pour tous les clients, il est plus logique d'avoir une distribution des taux d'abandon (ou des probabilités dans le cas BG / NBD).

μ(0;1)

J'espère que ça aide. Jetez un oeil à l'article original (Schmittlein et al., 1987) si vous ne l'avez pas déjà fait - ils passent par une partie de l'intuition là-bas.

Lyuba B.
la source
Merci pour ce travail acharné et cette explication claire. La raison de l'utilisation de la distribution gamma est qu'elle est relativement facile à utiliser et qu'elle est souvent utilisée comme priorité pour les paramètres positifs dans différents paramètres. Bien que les formes de la plupart des distributions gamma (avec différentes valeurs de paramètres) soient faciles à comprendre, mais pour adapter «l'hétérogénéité des taux de transaction entre les clients» à une distribution gamma qui chute presque de façon exponentielle (pour k = 1, thêta = 2 comme dans le graphique Wikipedia [ ici] en.wikipedia.org/wiki/Gamma_distribution ) est peu difficile à comprendre. Excluons-nous un tel comportement?
user3282777
1
Vos estimations pour les paramètres Gamma dépendront des données avec lesquelles vous travaillez. Le fait est que la distribution Gamma peut avoir des formes sensiblement différentes basées sur seulement deux paramètres, et vous pouvez laisser les données parler pour elles-mêmes, sans imposer d'hypothèses trop strictes (plus ou moins).
Lyuba B.