Big Data bei TUI

29.04.2019

Auch bei der TUI hat Big Data Einzug erhalten - und das in vielen Ausprägungen! Die klassischen 3 Big Data V's - Volume, Variety und Velocity finden sich bei uns wieder:

Volume - große Datenmengen

Mit über 90.000 Hotels, 365 Anreisetagen pro Saison, mehr als 800 Zielgebieten und einer eigenen Preissetzungsherausforderung für jede Zimmer-, Tages- und Belegungskombination wird schnell klar: hier kommen wirklich große Datenmengen zusammen.

Viele Optimierungsprobleme bei TUI erfordern den Einsatz von Big Data Technologien, um auch große Datenmengen schnell, kostengünstig und effizient analysieren und darauf basierend sinnvolle Entscheidungen treffen zu können.

Neben Bestandsdaten analysieren wir Bewegungsdaten wie z.B. Clickstreams von Website-Besuchern und technische Logmeldungen unserer Flugzeugflotte. Auch hier fallen enorme Datenmengen an, die ohne Big Data Technologie nicht sinnvoll zu bearbeiten wären.

Variety – Vielfalt der Daten

Auch hier haben wir es bei der TUI mit einer großen Datenvielfalt und unstrukturierten Daten zu tun.

Von Hotelbildern, natürlichsprachlichen Hotelbewertungen oder unstrukturierten Lognachrichten - unsere Datenwelt ist so genauso vielfältig wie das TUI Produktportfolio.

Velocity - Geschwindigkeit

Im Big Data Umfeld verwenden wir bei der TUI auch Streamingtechnologien. Damit gehen wir über die klassische Batchverarbeitung von Daten hinaus und implementieren moderne Lambdaarchitekturen um immer am Puls der Zeit zu sein.

So stellen wir sicher, dass die Urlaubsentscheidungen von heute auch auf Daten von heute basieren - ganz schön up-to-date!

Einen Schritt weiter: Value – Businesswert

Ein weiteres wichtiges V neben den klassischen 3 Big Data V’s stellt bei der TUI das V für ‚Business-Value‘ dar.

Denn Big Data ist bei der TUI kein Selbstzweck, sondern jede Lösung hat stets ein klar umrissenes Business-Ziel im Visier.

Wie setzen wir es um?

Zur Bearbeitung der unterschiedlichen Aufgaben betreiben wir unter anderem ein Cloudera Hadoopcluster in der Amazon Cloud. Durch Einsatz des Cloudera Directors können wir dabei auf eine hochentwickelte Technologie unseres Partners Cloudera zurückgreifen, die die Einrichtung des Clusters zeitgemäß automatisiert.

Über den Cloudera Manager können wir stets alle Clusterressourcen optimal steuern und behalten den Überblick.

Die Abläufe des Hadoopclusters fügen sich dank der Integration in unsere unternehmensweite „UC4 Automic“ Schedulinglösung nahtlos in alle weiteren Betriebsabläufe ein. Big Data und klassische Technologien arbeiten so bei uns Hand in Hand.

Carsten Arndt (Senior IT Developer) & Johanna Schnier (Data Scientist)