
In dieser Episode des Data Rant Podcasts diskutieren Orell und Uli die Herausforderungen im Data Consulting, insbesondere im Kontext von Spark und Datenstrategien. Sie beleuchten die Komplexität der Datenverarbeitung, die Vorteile von Apache Spark, insbesondere im Hinblick auf Massive Parallel Processing, und die Notwendigkeit einer sorgfältigen Datenvorbereitung. Zudem wird die Kosteneffizienz und Infrastruktur von Spark thematisiert, sowie die Vorteile der Streaming API und der Konnektoren. Abschließend geben sie Einblicke in die Bedeutung von Spark im Data Engineering und die Herausforderungen, die damit verbunden sind.
Orell Garten:
LinkedIn: https://www.linkedin.com/in/ogarten/
Website: https://orellgarten.com
Ulrich Ludman:
LinkedIn: https://www.linkedin.com/in/ulrich-ludmann/
Website: https://kakadu-labs.de/
Video Chapters
00:00 Einführung in den Data Rant Podcast
02:46 Herausforderungen im Data Consulting
06:05 Die Komplexität von Datenstrategien
09:01 Einführung in Apache Spark
11:50 Massive Parallel Processing und seine Vorteile
14:54 Datenvorbereitung für Spark
17:48 Kosteneffizienz und Infrastruktur
20:53 Streaming und Datenintegration mit Spark
23:32 Abschluss