Einführung in Apache Spark

Diese Schulung "Einführung in Apache Spark" bietet eine umfassende Einführung der Datenverarbeitung und -analyse mit Apache Spark. Die Schulung ist darauf ausgerichtet, den Teilnehmern ein solides Verständnis für die Grundlagen von Apache Spark zu vermitteln sowie fortgeschrittene Konzepte und Anwendungen zu erläutern. Die Teilnehmer werden in die Architektur von Apache Spark eingeführt und lernen, wie sie RDDs, DataFrames, Datasets, Spark SQL, Spark Streaming, MLlib und GraphX effektiv nutzen können. Durch praxisnahe Übungen und Anwendungen erhalten die Teilnehmer praktische Erfahrungen in der Entwicklung von Spark-Anwendungen und der Verarbeitung von Daten in Echtzeit.

Trainer und Dozenten

Uli Zellbeck ist erfahrener Trainer und verfügt über 25 Jahre Erfahrung in der IT-Branche. Als Senior Data Architect bringt er ein tiefgreifendes Know-how im Aufbau von Datenarchitekturen mit. Seine Expertise erstreckt sich über verschiedene Bereiche der Informationstechnologie, und er hat sich insbesondere auf die Entwicklung fortschrittlicher Datenlösungen on Premise und in der Cloud spezialisiert.

Die Teilnehmer können von seinem reichen Erfahrungsschatz profitieren, während er praxisnahe Einblicke in die Verarbeitung von großen Datenmengen in Apache Spark zeigt.

Voraussetzungen

Die Teilnehmer sollten über grundlegende Kenntnisse in der Programmierung und Datenverarbeitung verfügen. Erfahrungen mit einer Programmiersprache wie Scala, Java oder Python sind erforderlich. Ein grundlegendes Verständnis von Datenbanken und SQL wird ebenfalls empfohlen. Es werden keine spezifischen Vorkenntnisse in Apache Spark vorausgesetzt, da die Schulung eine umfassende Einführung bietet.

Inhalt

Agenda für den Kurs "Apache Spark: Grundlagen und Fortgeschrittene Themen":

Apache Spark Schulungsinhalte

  • Tag 1: Einführung und Grundlagen
    • Einführung in Apache Spark
      • Überblick über Apache Spark und seine Einsatzmöglichkeiten
      • Geschichte und Entwicklung von Apache Spark
    • Grundlagen von Apache Spark
      • Architektur von Apache Spark
      • RDDs (Resilient Distributed Datasets) und deren Bedeutung
      • Installation von Apache Spark und Einrichtung einer Entwicklungsumgebung
    • Spark Core
      • Spark Session und Spark Context
      • Transformationen und Aktionen auf RDDs
    • Hands-On Übung
      • Erste Schritte mit Apache Spark: Einfache Transformationen und Aktionen durchführen
  • Tag 2: Fortgeschrittene Konzepte
    • DataFrames und Datasets
      • Einführung in DataFrames und Datasets
      • Unterschiede zu RDDs
    • Datenmanipulation mit DataFrames
      • Filtern, Gruppieren, Sortieren von Daten
      • Lesen und Schreiben von Daten in verschiedenen Formaten
    • Spark SQL
      • Erstellen und Ausführen von SQL-Abfragen mit Spark SQL
    • Hands-On Übung
      • Anwendung von DataFrames und Spark SQL auf reale Datensätze
  • Tag 3: Fortgeschrittene Themen und Anwendungen
    • Spark Streaming
      • Einführung in Echtzeitdatenverarbeitung mit Spark Streaming
      • Verarbeitung von Datenströmen mit DStreams
    • Machine Learning mit MLlib
      • Grundlagen des maschinellen Lernens mit Spark
      • Anwendung von MLlib für typische ML-Aufgaben
    • GraphX
      • Einführung in die Graphenverarbeitung mit GraphX
      • Erstellen und Analysieren von Graphen
    • Abschlussdiskussion und Ausblick
      • Best Practices für den Einsatz von Apache Spark
      • Möglichkeiten für weiterführende Schulungen und Ressourcen
      • Feedback und Abschluss der Schulung

Kurszeiten

Wer möchte, reist bis 22 Uhr am Vortag an und nutzt den Abend bereits zum Fachsimpeln am Kamin oder im Park.

An Kurstagen gibt es bei uns ab 8 Uhr Frühstück.

Unsere Kurse beginnen um 9 Uhr und enden um 18 Uhr.

Neben den kleinen Pausen gibt es eine Stunde Mittagspause mit leckerem, frisch in unserer Küche zubereitetem Essen.

Nach der Schulung anschließend Abendessen und Angebote für Fachsimpeln, Ausflüge uvm. Wir schaffen eine Atmosphäre, in der Fachleute sich ungezwungen austauschen. Wer das nicht will, wird zu nichts gezwungen und findet auch jederzeit Ruhe.

Preis und Dauer

3 Tage,
1.500,00 € + 19% MwSt. = 1.785,00 €

Übernachtungsoptionen

Termine und Anmeldung
  • 16. Juni 2025, 3 Tage
    Einführung in Apache Spark anmelden
  • 24. November 2025, 3 Tage
    Einführung in Apache Spark anmelden

Haben Sie einen anderen Wunschtermin?

Verwandte Seminare ...

...