Tarifs des compagnies aériennes - Quelle analyse doit-on utiliser pour détecter les comportements concurrentiels de fixation des prix et les corrélations de prix?

12

Je veux étudier le comportement de fixation des prix des compagnies aériennes - en particulier la façon dont les compagnies aériennes réagissent aux prix des concurrents.

Comme je dirais que mes connaissances sur l'analyse plus complexe sont assez limitées, j'ai principalement utilisé toutes les méthodes de base pour recueillir une vue d'ensemble des données. Cela inclut des graphiques simples qui aident déjà à identifier des modèles similaires. J'utilise également SAS Enterprise 9.4.

Cependant, je recherche une approche plus basée sur les nombres.

Base de données

L'ensemble de données (auto) collectées que j'utilise contient environ 54 000 tarifs. Tous les tarifs ont été collectés dans un délai de 60 jours, sur une base quotidienne (tous les soirs à 00h00).Méthode de collecte

Par conséquent, chaque tarif dans cette fenêtre horaire se produit fois sous réserve de la disponibilité du tarif ainsi que de la date de départ du vol, lorsqu'il est dépassé par la date de perception du tarif. (Vous ne pouvez pas percevoir de tarif pour un vol lorsque la date de départ du vol est passée)n

Le non formaté qui ressemble essentiellement à ceci: (fausses données)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" est calculé via oùI=sc

  • I & intervalle (jours avant le départ)
  • s & date du prix (départ du vol)
  • c & date à laquelle le tarif a été perçu

Voici un exemple d'ensemble de données groupées par I (DaysBeforeDep.) (Fausses données!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Ce que j'ai trouvé jusqu'à présent

En regardant les graphiques linéaires, je peux déjà estimer que plusieurs lignes auront un facteur de corrélation élevé. Par conséquent, j'ai essayé d'utiliser l'analyse de corrélation d'abord sur les données groupées. Mais est-ce la bonne façon? En gros j'essaye maintenant de faire des corrélations sur les moyennes plutôt que sur les prix individuels? Y a-t-il un autre moyen?

Je ne sais pas quel modèle de régression convient ici, car les prix ne se déplacent sous aucune forme linéaire et semblent non linéaires. Aurais-je besoin d'adapter un modèle à chacune des évolutions de prix d'une compagnie aérienne

PS: Ceci est un long mur de texte. Si j'ai besoin de clarifier quoi que ce soit, faites le moi savoir. Je suis nouveau dans ce sous-marin.

Quelqu'un un indice? :-)

s1x
la source

Réponses:

9

Mot d'avertissement d'un ancien analyste de Revenue Management de la compagnie aérienne: vous aboyez peut-être le mauvais arbre avec cette approche. Toutes mes excuses pour le mur de texte qui suit, mais ces données sont beaucoup plus complexes et bruyantes qu'il n'y paraît à première vue, donc je voulais fournir une brève description de la façon dont elles sont générées; averti est avant-bras.

Les tarifs des compagnies aériennes ont deux composantes: tous les tarifs réels (avec les règles tarifaires et ce que vous avez) qu'une compagnie aérienne a à disposition pour un certain trajet, dont la plupart sont publiés par la Airline Tariff Publishing Company (quelques-uns à usage spécial sont non, mais ce sont l'exception plutôt que la règle) et la gestion réelle des stocks effectuée par la compagnie aérienne au quotidien.

Les tarifs peuvent être soumis à ATPCO quatre fois par jour, à intervalles fixes, et lorsque les compagnies aériennes le font, il s'agit généralement d'un mélange d'ajouts, de suppressions et de modifications des tarifs existants. Lorsqu'une compagnie aérienne lance une action de tarification (en supposant que ses concurrents n'essaient pas de faire leurs propres mouvements ici), ils doivent généralement attendre la prochaine mise à jour pour voir si leurs concurrents suivent / répondent. L'inverse se produit lorsqu'un concurrent lance une action de tarification, car la compagnie aérienne doit attendre la prochaine mise à jour avant de pouvoir répondre.

Maintenant, tout va bien en ce qui concerne les tarifs, mais le problème est que, parce que tout est publié dans ATPCO, les tarifs sont la prochaine meilleure chose à l'information publique ... tous vos concurrents peuvent voir ce que vous avez dans votre arsenal, les tentatives d'obscurcissement ne sont donc pas inconnues, telles que la publication de tarifs auxquels aucun inventaire ne sera réellement attribué, la liste de tous les tarifs comme jour de départ, etc.

À bien des égards, la sauce secrète se résume à la répartition réelle des stocks, c'est-à-dire combien de sièges sur chaque vol serez-vous prêt à vendre pour un tarif donné, et cette information n'est pas accessible au public. Vous pouvez obtenir quelques aperçus en grattant les informations Web, mais les combinaisons potentielles d'heure / date de départ et de règles tarifaires sont assez nombreuses et peuvent rapidement dégénérer au-delà de votre capacité à suivre facilement.

En règle générale, une compagnie aérienne ne sera disposée à vendre qu'une poignée de sièges à un prix très bas et les personnes qui les accrocheront doivent réserver assez longtemps à l'avance de peur que les règles tarifaires ne les bloquent, ou que d'autres voyageurs ne les battent simplement. La compagnie aérienne sera disposée à vendre quelques sièges supplémentaires pour un tarif plus élevé, et ainsi de suite. Ils seront très heureux de vendre tous les sièges au prix le plus élevé qu'ils ont publié, mais ce n'est généralement pas faisable.

Ce que vous voyez avec des tarifs plus élevés à mesure que vous vous rapprochez du jour du départ est simplement le processus naturel de réserver les sièges à bas prix, tandis que l'inventaire restant devient progressivement plus cher. Bien sûr, il y a quelques mises en garde ici. Le processus RM est activement géré et l'intervention humaine est assez courante, car l'équipe RM s'efforce généralement d'atteindre ses objectifs de revenus et de maximiser les revenus sur chaque vol. En tant que tel, les vols qui se remplissent rapidement peuvent être «resserrés» en fermant les tarifs bas. Les vols qui réservent lentement peuvent être «assouplis» en allouant plus de sièges à des tarifs plus bas.

Il y a une interaction et une concurrence constantes entre les compagnies aériennes dans ce domaine, mais il est peu probable que vous capturiez la dynamique réelle simplement en grattant les tarifs. Ne vous méprenez pas, nous avions de tels outils à notre disposition et, malgré leurs limites, ils étaient assez précieux, mais ils n'étaient qu'une source de données qui a alimenté le processus décisionnel. Vous auriez besoin d'accéder aux centaines, voire aux milliers de décisions opérationnelles prises quotidiennement par les équipes RM, ainsi qu'aux informations sur l'état du monde telles qu'elles les voient à l'époque. Si vous ne trouvez pas de partenaire aérien avec lequel travailler afin d'obtenir ces données, vous devrez peut-être envisager d'autres sources de données.

Je recommanderais d'envisager d'accéder aux données sur les tarifs O&D du Guide officiel des compagnies aériennes (ou de l'un de leurs concurrents) et d'essayer de les utiliser pour votre analyse. Il est basé sur des échantillons (environ 10% de tous les billets vendus) et agrégé à un niveau supérieur à l'idéal, donc une sélection d'itinéraire prudente est impérative (je recommanderais quelque chose avec de nombreuses compagnies aériennes, volant sans escale plusieurs fois par jour, avec gros avions), mais vous pourrez peut-être avoir une meilleure idée de ce qui a été réellement vendu (tarif moyen) et de la quantité vendue (facteur de charge), par rapport à ce qui est disponible à la vente à un moment donné. En utilisant ces informations, vous pourriez être en meilleure position pour au moins explorer les résultats de la stratégie de tarification des compagnies aériennes et tirer vos conclusions à partir de là.

habu
la source
Merci pour votre explication approfondie. Je suis d'accord avec vous qu'une telle analyse basée uniquement sur les prix est assez limitée. Cela comprend également notamment les règles tarifaires (billets remboursables, séjour minimum, etc.). Certaines de ces limitations peuvent être surmontées en collectant toujours les mêmes tarifs pour faire la comparaison. Cependant, une information importante - comme vous l'avez mentionné, manque le nombre de sièges disponibles (peut être! = Sièges dans un avion) ​​et le montant réel des billets vendus.
s1x
L'accès à ces données est très limité et s'il est obsolète (par exemple, la banque de données 1B du US DOT). Certaines recherches telles que Clark R. et Vincent N. (2012) Le lien de tarification en fonction de la capacité [...] inclut de telles données et offre de bien meilleures perspectives. Je suis conscient des limites (j'espère ;-)) et comme vous l'avez mentionné, il y a beaucoup plus d'informations qui influencent les prix. Toujours lors de l' observation d' un marché spécifique , vous pouvez obtenir un sentiment de ce qui se passe. Vous pouvez voir s'il existe un comportement concurrentiel et différentes approches de stratégie de tarification. Cependant, vous ne pourriez jamais trouver la cause.
s1x
1
@ s1x - Je suis d'accord et j'aurais aimé avoir une alternative solide à offrir, mais, comme vous l'avez vous-même appris, les données détaillées sur les revenus sont le secret le plus jalousement gardé de toute compagnie aérienne. Je voulais simplement m'assurer que vous en êtes conscient et de ce qui se passe dans le processus de génération de données. Au-delà, j'aime ce que vous essayez de faire et je pense que l'autre réponse est un pas dans la bonne direction, techniquement. Si je peux suggérer, vous pouvez également envisager d'utiliser la corrélation croisée entre vos différents TS lors de votre exploration de données, car elle est souvent utile pour discerner les modèles entre les TS liés.
habu
4

En plus de l'analyse exploratoire des données (EDA), à la fois descriptive et visuelle, j'essaierais d'utiliser l' analyse des séries chronologiques comme une analyse plus complète et sophistiquée . Plus précisément, j'effectuerais une analyse de régression de séries chronologiques . L'analyse des séries chronologiques est un vaste domaine de recherche et de pratique.Par conséquent, si vous n'êtes pas familier avec les principes fondamentaux, je suggère de commencer par l'article Wikipédia ci-dessus, de rechercher progressivement des sujets plus spécifiques et de lire les articles, articles et livres correspondants.

Depuis l' analyse des séries chronologiques est une très populaire approche, il est pris en charge par la plupart open source et la source fermée commerciale la science des données et statistiques des environnements (logiciels) , tels que R , Python , SAS , SPSS et bien d' autres. Si vous souhaitez utiliser R pour cela, consultez mes réponses sur l'analyse générale des séries chronologiques et sur la classification et le regroupement des séries chronologiques . J'espère que cela vous sera utile.

Aleksandr Blekh
la source
Merci pour votre réponse @Aleksandr Blekh - vraiment apprécié. Je vais creuser ça. Peut-être une question stupide, mais veuillez me corriger ici si je me trompe ici: une analyse de corrélation, tout en utilisant une compagnie aérienne comme variable à corréler. Les résultats ont été convaincants jusqu'à présent, comme certaines compagnies aériennes en particulier. ceux qui avaient des accords de partage de code avaient des prix similaires. Est-ce que de telles corrélations élevées, par exemple: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 Je suppose que ces résultats indiquent des modèles de prix similaires. Avec une analyse de régression, que découvrirais-je?
s1x
@ s1x: vous êtes les bienvenus (n'hésitez pas à voter / accepter, si vous appréciez la réponse et quand vous aurez suffisamment de réputation pour le faire, bien sûr). Passons maintenant à votre question. Comme je l'ai dit, l'analyse TS est plus sophistiquée et complète. En particulier, la régression TS, explique la soi-disant autorégression et d'autres complexités TS. Par conséquent, ma suggestion d'utiliser l'analyse de régression TS au lieu d'une analyse traditionnelle plus simple. En outre, vous devriez toujours commencer par EDA, quelle que soit l'analyse de données que vous prévoyez d'effectuer (en fait, EDA changera souvent vos plans).
Aleksandr Blekh