Tariffe aeree - Quale analisi dovrebbe essere utilizzata per rilevare il comportamento competitivo e la correlazione dei prezzi?


12

Voglio indagare sul comportamento di determinazione dei prezzi delle compagnie aeree, in particolare su come le compagnie aeree reagiscono ai prezzi dei concorrenti.

Come direi che la mia conoscenza di analisi più complesse è piuttosto limitata, ho fatto principalmente tutti i metodi di base per raccogliere una visione generale dei dati. Ciò include grafici semplici che aiutano già a identificare modelli simili. Sto anche usando SAS Enterprise 9.4.

Tuttavia sto cercando un approccio più basato sui numeri.

Set di dati

Il set di dati (auto) raccolti che sto usando contiene circa 54.000 tariffe. Tutte le tariffe sono state raccolte in una finestra temporale di 60 giorni, su base giornaliera (ogni notte alle 00:00).Metodo di raccolta

Pertanto, ogni tariffa entro tale intervallo di tempo si verifica n volte in base alla disponibilità della tariffa e alla data di partenza del volo, quando viene superata dalla data di raccolta della tariffa. (Non è possibile riscuotere una tariffa per un volo quando la data di partenza del volo è in passato)

Il non formattato che assomiglia sostanzialmente a questo: (dati falsi)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" viene calcolato tramite I=sc dove

  • I e intervallo (giorni prima della partenza)
  • s & data della tariffa (partenza del volo)
  • c & data di raccolta della tariffa

Ecco un esempio di set di dati raggruppati di I (DaysBeforeDep.) (Dati falsi!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Quello che mi è venuto in mente finora

Guardando i grafici a linee posso già stimare che diverse linee avranno un alto fattore di correlazione. Quindi, ho provato ad usare prima l'analisi di correlazione sui dati raggruppati. Ma è quello il modo corretto? Fondamentalmente provo ora a fare correlazioni sulle medie piuttosto che sui singoli prezzi? C'è un altro modo?

Non sono sicuro di quale modello di regressione si adatti qui, poiché i prezzi non si muovono in alcuna forma lineare e appaiono non lineari. Avrei bisogno di adattare un modello a ciascuno degli sviluppi di prezzo di una compagnia aerea

PS: questo è un lungo muro di testo. Se ho bisogno di chiarire qualcosa fammi sapere. Sono nuovo di questo sub.

Qualcuno ha un indizio? :-)

Risposte:


9

Avvertimento da un ex analista di Revenue Management della compagnia aerea: potresti abbaiare l'albero sbagliato con questo approccio. Ci scusiamo per il muro di testo che segue, ma questi dati sono molto più complessi e rumorosi di quanto potrebbero apparire a prima vista, quindi volevo fornire una breve descrizione di come è stato generato; uomo avvisato mezzo salvato.

Le tariffe delle compagnie aeree hanno due componenti: tutte le tariffe effettive (complete con le regole tariffarie e che cosa hai) che una compagnia aerea ha a disposizione per una determinata rotta, la maggior parte delle quali sono pubblicate dalla compagnia aerea di pubblicazione delle tariffe aeree (alcune sono quelle speciali no, ma quelli sono l'eccezione piuttosto che la regola) e l'effettiva gestione dell'inventario effettuata dalla compagnia aerea su base giornaliera.

Le tariffe possono essere inviate ad ATPCO quattro volte al giorno, a intervalli prestabiliti, e quando le compagnie aeree lo fanno, di solito consistono in una combinazione di aggiunte, cancellazioni e modifiche delle tariffe esistenti. Quando una compagnia aerea avvia un'azione di determinazione del prezzo (supponendo che i suoi concorrenti non stiano provando a fare le proprie mosse qui), di solito devono attendere fino al prossimo aggiornamento per vedere se i loro concorrenti seguono / rispondono. Il contrario avviene quando un concorrente avvia un'azione di determinazione del prezzo, poiché la compagnia aerea deve attendere il prossimo aggiornamento prima di poter rispondere.

Ora, va tutto bene rispetto alle tariffe, ma il problema è che, poiché tutto questo viene pubblicato su ATPCO, le tariffe sono la cosa migliore per le informazioni pubbliche ... tutti i tuoi concorrenti vedranno ciò che hai nel tuo arsenale, quindi i tentativi di offuscare non sono inauditi, come la pubblicazione di tariffe a cui non verrà mai assegnato alcun inventario, che elenca tutte le tariffe come giorno di partenza, ecc.

In molti modi, la salsa segreta si riduce all'effettiva allocazione dell'inventario, cioè quanti posti su ciascun volo sarai disposto a vendere per una determinata tariffa e queste informazioni non sono disponibili al pubblico. Puoi ottenere alcuni scorci raschiando le informazioni sul web, ma le potenziali combinazioni di ora / data di partenza e regole tariffarie sono piuttosto numerose e potrebbero rapidamente aumentare oltre la tua capacità di tenere facilmente traccia.

In genere una compagnia aerea sarà disposta a vendere solo una manciata di posti per una tariffa molto bassa e le persone che si impadroniscono di essi devono prenotare con largo anticipo per evitare che le regole tariffarie li blocchino, o altri viaggiatori semplicemente li picchiano. La compagnia aerea sarà disposta a vendere alcuni posti in più per una tariffa più elevata, e così via e così via. Saranno abbastanza felici di vendere tutti i posti per la tariffa più alta che hanno pubblicato, ma questo di solito non è fattibile.

Quello che vedi con le tariffe che aumentano man mano che ti avvicini al giorno della partenza è semplicemente il naturale processo di prenotazione dei posti più economici, mentre l'inventario rimanente diventa gradualmente più costoso. Naturalmente, ci sono alcuni avvertimenti qui. Il processo di RM è gestito attivamente e l'intervento umano è abbastanza comune poiché il team di RM si sforza generalmente di raggiungere i suoi obiettivi di guadagno e massimizzare le entrate su ogni volo. Pertanto, i voli che si riempiono rapidamente possono essere "ridotti" chiudendo le tariffe basse. I voli che prenotano lentamente possono essere "allentati" assegnando più posti a tariffe più basse.

Esiste una costante interazione e concorrenza tra le compagnie aeree in questo settore, ma non è molto probabile che catturi le dinamiche reali solo dalle tariffe di scraping. Non fraintendetemi, avevamo a nostra disposizione tali strumenti e, nonostante le loro limitazioni, erano piuttosto preziosi, ma erano solo una fonte di dati che alimentava il processo decisionale. Avresti bisogno di accedere a centinaia, se non a migliaia di decisioni operative prese dai team RM su base giornaliera, così come alle informazioni sullo stato del mondo come le vedono in quel momento. Se non riesci a trovare un partner della compagnia aerea con cui lavorare per ottenere questi dati, potresti dover considerare fonti di dati alternative.

Consiglio di cercare di ottenere l'accesso ai dati tariffari O&D dalla Guida aerea ufficiale (o di uno dei loro concorrenti) e di provare a utilizzarli per la tua analisi. È basato su un campione (circa il 10% di tutti i biglietti venduti) e aggregato a un livello superiore rispetto a quello ideale, quindi è indispensabile un'attenta selezione del percorso (raccomanderei qualcosa con molte compagnie aeree, che voli non-stop più volte al giorno, con aeromobili di grandi dimensioni), ma potresti essere in grado di ottenere un quadro migliore di ciò che è stato effettivamente venduto (tariffa media) e di quanto è stato venduto (fattore di carico), rispetto a ciò che è disponibile per la vendita in un determinato momento. Utilizzando tali informazioni potresti trovarti in una posizione migliore per esplorare almeno i risultati della strategia tariffaria delle compagnie aeree e trarre le tue conclusioni da lì.


Grazie per la tua spiegazione approfondita. Concordo con te sul fatto che tale analisi basata solo sui prezzi è piuttosto limitata. Ciò include anche in particolare le regole tariffarie (biglietti rimborsabili, soggiorno minimo ecc.) Alcune di queste limitazioni possono essere superate raccogliendo sempre le stesse tariffe per rendere comparabili. Tuttavia, un'informazione importante - come hai detto, manca la quantità di posti disponibili (può essere! = Posti in un aereo) e la quantità effettiva di biglietti venduti.
s1x,

L'accesso a tali dati è molto limitato e se non è aggiornato (ad es. Banca dati 1B da DOT USA). Alcune ricerche come Clark R. e Vincent N. (2012) Il collegamento di prezzi contingenti [...] di capacità include tali dati e offre approfondimenti molto migliori. Sono consapevole dei limiti (si spera ;-)) e come hai detto in quanto vi sono molte più informazioni che influenzano i prezzi. Tuttavia, osservando un mercato specifico, puoi avere la sensazione di ciò che accade. Puoi vedere se esiste un comportamento competitivo e approcci di strategia di prezzo diversi. Tuttavia, non saresti mai in grado di trovare la causa.
s1x,

1
@ s1x - Sono d'accordo e vorrei avere una solida alternativa da offrire, ma, come hai imparato tu stesso, i dati dettagliati sulle entrate sono il segreto più gelosamente custodito di qualsiasi compagnia aerea. Volevo solo assicurarmi di essere a conoscenza di ciò e di ciò che va nel processo di generazione dei dati. Inoltre, mi piace quello che stai cercando di fare e penso che l'altra risposta sia un passo nella giusta direzione, dal punto di vista tecnico. Se potessi suggerire, potresti anche dare un'occhiata all'utilizzo della correlazione incrociata tra i vari TS durante l'esplorazione dei dati, poiché è spesso utile per discernere schemi tra TS collegati.
habu,

4

Oltre all'analisi esplorativa dei dati (EDA), sia descrittiva che visiva, proverei a usare l' analisi delle serie temporali come analisi più completa e sofisticata . In particolare, avrei eseguito l'analisi di regressione delle serie storiche . L'analisi delle serie temporali è un enorme dominio di ricerca e pratica, quindi, se non si ha familiarità con i fondamenti, suggerisco di iniziare con l'articolo Wikipedia collegato sopra, alla ricerca progressiva di argomenti più specifici e leggere articoli, documenti e libri corrispondenti.

Poiché l'analisi delle serie temporali è un approccio molto popolare , è supportata dalla maggior parte degli ambienti di scienza e dati statistici (software) di dati commerciali open source e chiusi , come R , Python , SAS , SPSS e molti altri. Se vuoi usare R per questo, controlla le mie risposte sull'analisi generale delle serie storiche e sulla classificazione e il raggruppamento delle serie storiche . Spero che questo sia di aiuto.


Grazie per la tua risposta @Aleksandr Blekh - davvero apprezzato. Scenderò proprio in quello. Forse una domanda stupida, ma per favore correggimi qui se sbaglio qui: un'analisi di correlazione, usando una compagnia aerea come variabile con cui correlare. I risultati sono stati convincenti finora, come alcune compagnie aeree espc. quelli che avevano accordi di codeshare avevano prezzi simili. Correlazioni così elevate, ad esempio: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 presumo che tali risultati indichino modelli di prezzo simili. Con un'analisi di regressione, cosa avrei scoperto?
1x

@ s1x: sei il benvenuto (sentiti libero di votare / accettare, se apprezzi la risposta e quando avrai abbastanza reputazione per farlo, ovviamente). Ora, passiamo alla tua domanda. Come ho detto, l'analisi TS è più sofisticata e completa. In particolare la regressione TS, spiega la cosiddetta autoregressione e altre complessità TS. Quindi, il mio suggerimento di utilizzare l'analisi di regressione TS invece di quella tradizionale più semplice. Inoltre, dovresti sempre iniziare con EDA, indipendentemente dall'analisi dei dati che prevedi di eseguire (in realtà, EDA spesso modificherà i tuoi piani).
Aleksandr Blekh,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.