Trainer und Dozenten
Uli Zellbeck ist erfahrener Trainer und verfügt über 25 Jahre Erfahrung in der IT-Branche. Als Senior Data Architect bringt er ein tiefgreifendes Know-how im Aufbau von Datenarchitekturen mit. Seine Expertise erstreckt sich über verschiedene Bereiche der Informationstechnologie, und er hat sich insbesondere auf die Entwicklung fortschrittlicher Datenlösungen on Premise und in der Cloud spezialisiert.
Die Teilnehmer können von seinem reichen Erfahrungsschatz profitieren, während er praxisnahe Einblicke in die Verarbeitung von großen Datenmengen in Apache Spark zeigt.
Voraussetzungen
Die Teilnehmer sollten über grundlegende Kenntnisse in der Programmierung und Datenverarbeitung verfügen. Erfahrungen mit einer Programmiersprache wie Scala, Java oder Python sind erforderlich. Ein grundlegendes Verständnis von Datenbanken und SQL wird ebenfalls empfohlen. Es werden keine spezifischen Vorkenntnisse in Apache Spark vorausgesetzt, da die Schulung eine umfassende Einführung bietet.
Inhalt
Apache Spark Schulungsinhalte
- Tag 1: Einführung und Grundlagen
- Einführung in Apache Spark
- Überblick über Apache Spark und seine Einsatzmöglichkeiten
- Geschichte und Entwicklung von Apache Spark
- Grundlagen von Apache Spark
- Architektur von Apache Spark
- RDDs (Resilient Distributed Datasets) und deren Bedeutung
- Installation von Apache Spark und Einrichtung einer Entwicklungsumgebung
- Spark Core
- Spark Session und Spark Context
- Transformationen und Aktionen auf RDDs
- Hands-On Übung
- Erste Schritte mit Apache Spark: Einfache Transformationen und Aktionen durchführen
- Tag 2: Fortgeschrittene Konzepte
- DataFrames und Datasets
- Einführung in DataFrames und Datasets
- Unterschiede zu RDDs
- Datenmanipulation mit DataFrames
- Filtern, Gruppieren, Sortieren von Daten
- Lesen und Schreiben von Daten in verschiedenen Formaten
- Spark SQL
- Erstellen und Ausführen von SQL-Abfragen mit Spark SQL
- Hands-On Übung
- Anwendung von DataFrames und Spark SQL auf reale Datensätze
- Tag 3: Fortgeschrittene Themen und Anwendungen
- Spark Streaming
- Einführung in Echtzeitdatenverarbeitung mit Spark Streaming
- Verarbeitung von Datenströmen mit DStreams
- Machine Learning mit MLlib
- Grundlagen des maschinellen Lernens mit Spark
- Anwendung von MLlib für typische ML-Aufgaben
- GraphX
- Einführung in die Graphenverarbeitung mit GraphX
- Erstellen und Analysieren von Graphen
- Abschlussdiskussion und Ausblick
- Best Practices für den Einsatz von Apache Spark
- Möglichkeiten für weiterführende Schulungen und Ressourcen
- Feedback und Abschluss der Schulung
- Einführung in Apache Spark
- Überblick über Apache Spark und seine Einsatzmöglichkeiten
- Geschichte und Entwicklung von Apache Spark
- Grundlagen von Apache Spark
- Architektur von Apache Spark
- RDDs (Resilient Distributed Datasets) und deren Bedeutung
- Installation von Apache Spark und Einrichtung einer Entwicklungsumgebung
- Spark Core
- Spark Session und Spark Context
- Transformationen und Aktionen auf RDDs
- Hands-On Übung
- Erste Schritte mit Apache Spark: Einfache Transformationen und Aktionen durchführen
- DataFrames und Datasets
- Einführung in DataFrames und Datasets
- Unterschiede zu RDDs
- Datenmanipulation mit DataFrames
- Filtern, Gruppieren, Sortieren von Daten
- Lesen und Schreiben von Daten in verschiedenen Formaten
- Spark SQL
- Erstellen und Ausführen von SQL-Abfragen mit Spark SQL
- Hands-On Übung
- Anwendung von DataFrames und Spark SQL auf reale Datensätze
- Spark Streaming
- Einführung in Echtzeitdatenverarbeitung mit Spark Streaming
- Verarbeitung von Datenströmen mit DStreams
- Machine Learning mit MLlib
- Grundlagen des maschinellen Lernens mit Spark
- Anwendung von MLlib für typische ML-Aufgaben
- GraphX
- Einführung in die Graphenverarbeitung mit GraphX
- Erstellen und Analysieren von Graphen
- Abschlussdiskussion und Ausblick
- Best Practices für den Einsatz von Apache Spark
- Möglichkeiten für weiterführende Schulungen und Ressourcen
- Feedback und Abschluss der Schulung
Kurszeiten
Wer möchte, reist bis 22 Uhr am Vortag an und nutzt den Abend bereits zum Fachsimpeln am Kamin oder im Park.
An Kurstagen gibt es bei uns ab 8 Uhr Frühstück.
Unsere Kurse beginnen um 9 Uhr und enden um 18 Uhr.
Neben den kleinen Pausen gibt es eine Stunde Mittagspause mit leckerem, frisch in unserer Küche zubereitetem Essen.
Nach der Schulung anschließend Abendessen und Angebote für Fachsimpeln, Ausflüge uvm. Wir schaffen eine Atmosphäre, in der Fachleute sich ungezwungen austauschen. Wer das nicht will, wird zu nichts gezwungen und findet auch jederzeit Ruhe.
Termine und Anmeldung
-
16. Juni 2025, 3 Tage
Einführung in Apache Spark anmelden -
24. November 2025, 3 Tage
Einführung in Apache Spark anmelden
Haben Sie einen anderen Wunschtermin?