Massive Parallel Processing mit Spark | Episode 3

https://is1-ssl.mzstatic.com/image/thumb/Podcasts211/v4/9d/5a/52/9d5a52ea-d7ae-4426-9cb0-b7bd5ca563d8/mza_6100568135085740558.jpg/600x600bb.jpg

The Data Rant.

Orell Garten und Ulrich Ludmann

6 episodes

2 days ago

Wir sprechen über unsere Erfahrungen aus der Praxis des Data Engineering, die wir als Freelancer jeden Tag in Projekten erleben.

Technology

RSS

All content for The Data Rant. is the property of Orell Garten und Ulrich Ludmann and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

Wir sprechen über unsere Erfahrungen aus der Praxis des Data Engineering, die wir als Freelancer jeden Tag in Projekten erleben.

Technology

https://d3t3ozftmdmh3i.cloudfront.net/staging/podcast_uploaded_nologo/43781274/43781274-1748606964573-6633fc63654fc.jpg

Massive Parallel Processing mit Spark | Episode 3 | The Data Rant.

The Data Rant.

27 minutes 34 seconds

3 months ago

Massive Parallel Processing mit Spark | Episode 3 | The Data Rant.

In dieser Episode des Data Rant Podcasts diskutieren Orell und Uli die Herausforderungen im Data Consulting, insbesondere im Kontext von Spark und Datenstrategien. Sie beleuchten die Komplexität der Datenverarbeitung, die Vorteile von Apache Spark, insbesondere im Hinblick auf Massive Parallel Processing, und die Notwendigkeit einer sorgfältigen Datenvorbereitung. Zudem wird die Kosteneffizienz und Infrastruktur von Spark thematisiert, sowie die Vorteile der Streaming API und der Konnektoren. Abschließend geben sie Einblicke in die Bedeutung von Spark im Data Engineering und die Herausforderungen, die damit verbunden sind.

Orell Garten:

LinkedIn: https://www.linkedin.com/in/ogarten/

Website: https://orellgarten.com

Ulrich Ludman:

LinkedIn: https://www.linkedin.com/in/ulrich-ludmann/

Website: https://kakadu-labs.de/

Video Chapters

00:00 Einführung in den Data Rant Podcast

02:46 Herausforderungen im Data Consulting

06:05 Die Komplexität von Datenstrategien

09:01 Einführung in Apache Spark

11:50 Massive Parallel Processing und seine Vorteile

14:54 Datenvorbereitung für Spark

17:48 Kosteneffizienz und Infrastruktur

20:53 Streaming und Datenintegration mit Spark

23:32 Abschluss