4.08 out of 5
4.08
26 reviews on Udemy

Spark und Python für Big Data und Data Science mit PySpark

Lerne Apache Spark 2.3 mit Python einzusetzten (mit Machine Learning und Streaming)
Instructor:
Dr. René Brunner
422 students enrolled
Verwende Python und Spark zusammen, um Big Data zu analysieren.
Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
Arbeite an Consulting-Projekten, die reale Situationen nachahmen
Kundenabwanderung mit Logistischer Regression klassifizieren
Spark mit Entscheidungsbäumen für die Klassifizierung verwenden
Lernen, wie Sparks Gradient Boosted Trees verwendet wird
Verwende MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
Einrichtung von Amazon Web Services EC2 für Big Data-Analyse
Erfahren, wie Du AWS Elastic MapReduce Service verwenden kannst
Erstelle einen Spam-Filter mit Spark und Natural Language Processing
Verwende Spark Streaming, um Tweets in Echtzeit zu analysieren

Lerne die neueste Big Data Technologie – Spark! Und lerne es mit einer der beliebtesten Programmiersprachen, Python!

Eine der wertvollsten technologischen Kompetenzen ist die Fähigkeit, große Datenmengen zu analysieren. Dieser Kurs wurde speziell dafür entwickelt, Dich auf eine der besten Technologien für diese Aufgabe, Apache Spark, vorzubereiten! Die Top-Technologie-Unternehmen wie Google, Facebook, Netflix, Airbnb, Amazon, NASA und mehr verwenden alle Spark, um ihre Big-Data-Probleme zu lösen! Spark kann bis zu 100x schneller als Hadoop MapReduce ausgeführt werden, was zu einer Explosion der Nachfrage nach dieser Fähigkeit geführt hat!

Dieser Kurs vermittelt die Grundlagen mit einem Crash-Kurs in Python und lehrt weiterhin, wie man Spark DataFrames mit der neuesten Spark 2.0-Syntax verwendet! Sobald wir das besprochen haben, werden wir sehen, wie man die MLlib Machine Library mit der DataFrame-Syntax und Spark verwendet. Während jeder Lektion bekommst Du Übungen und simulierte Beratungs-Projekte, die Dich direkt in eine reale Situation bringen, in der Du deine neuen Fähigkeiten einsetzen kannst, um ein echtes Problem zu lösen!

Wir befassen uns auch mit den neuesten Spark-Technologien, wie Spark SQL, Spark Streaming und erweiterten Modellen wie Gradient Boosted Trees! Nachdem Du diesen Kurs absolviert hast, kannst Du selbstbewusst Spark und PySpark in Deinen Lebenslauf schreiben! Dieser Kurs hat auch eine volle 30 Tage Geld-zurück-Garantie!

Wenn Du bereit bist, in die Welt von Python, Spark und Big Data einzutauchen, dann ist dies der richtige Kurs für Dich!

Einführung in den Kurs

1
Einführung
2
Willkommen im Kurs
3
Kurs Übersicht
4
Häufig gestellte Fragen
5
Big Data Übersicht
6
Spark Übersicht

Alternative 1: Lokale Spark + Python Installation

1
Willkommen zur lokalen PySpark Einrichtung
2
Installations Optionen
3
Windows - Lokale Python Installation

So könnt ihr die Jupyter Notebooks, Anaconda und Python auf eurem Windows Computer installieren.

!!! MAC und Linux Nutzer können diese Lektion überspringen !!!

4
Windows - Lokale Java Installation
5
Windows - Lokale PySpark Installation
6
MAC- Lokale Python Installation

So könnt ihr die Jupyter Notebooks, Anaconda und Python auf eurem MAC oder Linux  Computer installieren.

!!! Windows Nutzer können diese Lektion überspringen !!!

7
MAC - Lokale PySpark Installation
8
Linux - Lokale PySpark Installation

Python Crashkurs

1
Python Crashkurs
2
Einführung in den Python Crashkurs
3
Jupyter Notebook Übersicht
4
Python Crashkurs Teil 1
5
Python Crashkurs Teil 2
6
Python Crashkurs Teil 3
7
Python Crashkurs Übungen
8
Python Crashkurs Übungen - Lösungen

Spark DataFrame Grundlagen

1
Willkommen zu den DataFrames
2
Einführung in DataFrame Grundlagen
3
Spark DataFrame Grundlagen Teil 1
4
Spark DataFrame Grundlagen Teil 2
5
Spark DataFrame Operationen

Learn some basic operations with Spark 2.0

6
GroupBy
7
Fehlende Werte
8
Timestamps

Spark DataFrame Projekt Übung

1
Willkommen zum Übungsprojekt
2
DataFrame Projekt Aufgabe
3
DataFrame Projekt Lösungen
4
Spark DataFrames Beratungsprojekt - Aufgabe
5
Spark DataFrames Beratungsprojekt - Lösungen

Einführung in Machine Learning mit MLlib

1
Willkommen zum Machine Learning Abschnitt
2
Machine Learning Einführung
3
Einführung in Machine Learning und ISLR
4
Machine Learning mit Spark und Python mit MLlib
5
Machine Learning Quiz

Lineare Regression

1
Lineare Regression Theorie
2
Lineare Regression Dokumentation Beispiel
3
Regression Evaluierung
4
Lineare Regression Beispiel Code Along
5
Lineare Regression Beratungsprojekt Aufgabe
6
Lineare Regression Beratungsprojekt Aufgabe - Lösungen

Logistische Regression

1
Logistische Regression Theorie
2
Logistische Regression Dokumentation Beispiel
3
Logistische Regression Code Along
4
Logistische Regression Beratungsprojekt
5
Logistische Regression Beratungsprojekt - Lösungen

Entscheidungsbäume und Random Forests

1
Entscheidungsbäume Einführung
2
Baum Methoden Dokumentationsbeispiel
3
Baum Methoden Code Along - Teil 1
4
Baum Methoden Code Along - Teil 2
5
Baum Methoden Beratungsprojekt Aufgabe
6
Baum Methoden Beratungsprojekt Aufgabe - Lösung

K-means Clustering

1
K-Means-Clustering Einführung
2
K-Means-Clustering Dokumentationsbeispiel
3
K-Means-Clustering Code Along
4
K-Means-Clustering Beratungsprojekt - Aufgabe
5
K-Means-Clustering Beratungsprojekt - Aufgabe - Lösungen

Empfehlungssysteme

1
Einführung in Empfehlungssysteme
2
Empfehlungssysteme - Code Along Projekt

Natural Language Processing

1
Natural Language Processing Einführung
2
NLP Tools - Teil 1
3
NLP Tools - Teil 2
4
NLP Tools - Teil 3
5
Natural Language Processing Beispiel

Spark Streaming with Python

1
Willkommen zum Spark Streaming Abschnitt
2
Einführung zu Streaming mit Spark
3
Netcat auf Windows
4
Spark Streaming Beispiel Code
5
Twitter Account Einrichten
6
Spark Streaming Twitter Project - Teil 1
7
Spark Streaming Twitter Project - Teil 2
8
Spark Streaming Twitter Project - Teil 3
9
Spark Streaming Twitter Project - Teil 4

Bonus: RDD Einführung

1
Lambda Expressions (Ausdrücke) Wiederholung
2
RDD Transformations und Actions - Teil 1
3
RDD Transformations und Actions - Teil 2
4
RDD Transformations und Actions - Teil 3

Alternative 2: AWS PySpark Installation

1
AWS Account Einrichtung
2
Kurze Notiz zur AWS Sicherheit
3
EC2 Instanz Installation
You can view and review the lecture materials indefinitely, like an on-demand channel.
Definitely! If you have an internet connection, courses on Udemy are available on any device at any time. If you don't have an internet connection, some instructors also let their students download course lectures. That's up to the instructor though, so make sure you get on their good side!
4.1
4.1 out of 5
26 Ratings

Detailed Rating

Stars 5
12
Stars 4
10
Stars 3
3
Stars 2
0
Stars 1
1
8f5225aafb274bf74bd37fff7df46e2b
30-Day Money-Back Guarantee

Includes

14 hours on-demand video
5 articles
Full lifetime access
Access on mobile and TV
Certificate of Completion