Course Outline
- Scala primer Μια γρήγορη εισαγωγή στα Scala Labs : Γνωριμία με τα βασικά στοιχεία του Scala Spark Ιστορικό και ιστορία Έννοιες και αρχιτεκτονική Spark και Hadoop Spark Spark eco system (core, spark sql, mlib, streaming) Labs : Εγκατάσταση και λειτουργία Spark Πρώτη ματιά στο Spark Running Spark στο τοπική λειτουργία Spark web UI Spark shell Ανάλυση δεδομένων – μέρος 1 Επιθεώρηση RDDs Labs: Spark shell exploration RDDs RDDs concepts Partitions RDD Operations/transformations RDD Types RDD Ζεύγος κλειδιού-τιμής Χάρτης RDD Reduce on RDD Αποθήκευση κρυφής μνήμης και εμμονή Εργαστήρια RDD : δημιουργία και επιθεώρηση RDD; Προσωρινή αποθήκευση RDDs Προγραμματισμός Spark API Εισαγωγή στο Spark API / RDD API Υποβολή του πρώτου προγράμματος στο Spark Debugging / logging Ιδιότητες διαμόρφωσης Labs : Προγραμματισμός στο Spark API, υποβολή εργασιών Spark SQL SQL Υποστήριξη στο Spark Dataframes Ορισμός πινάκων και εισαγωγή συνόλων δεδομένων Ερώτηση δεδομένων καρέ που χρησιμοποιούν SQL Μορφές αποθήκευσης : JSON / Parquet Labs : Δημιουργία και αναζήτηση πλαισίων δεδομένων. Αξιολόγηση των μορφών δεδομένων MLLIB MLLIB Εισαγωγή αλγορίθμων MLLIB MLLIB LABS: Γράφοντας εφαρμογές MLIB Εφαρμογές GraphX GraphX Βιβλιοθήκη Επισκόπηση GraphX APIS Labs HDFS / YARN) Αρχιτεκτονική Hadoop + Spark Running Spark on Hadoop YARN Επεξεργασία αρχείων HDFS με χρήση Spark Spark Performance and Tuning Μεταβλητές εκπομπής Accumulators Διαχείριση μνήμης και αποθήκευση στην κρυφή μνήμη Spark Operations Ανάπτυξη του Spark στην παραγωγή Πρότυπα ανάπτυξης δείγματος Διαμορφώσεις Παρακολούθηση Αντιμετώπιση προβλημάτων
Requirements
ΠΡΟΑΠΑΙΤΟΥΜΕΝΑ
εξοικείωση με τη γλώσσα Java / Scala / Python (τα εργαστήριά μας στο Scala και Python) βασική κατανόηση του περιβάλλοντος ανάπτυξης Linux (πλοήγηση γραμμής εντολών / επεξεργασία αρχείων με χρήση VI ή nano)
Testimonials (6)
Doing similar exercises different ways really help understanding what each component (Hadoop/Spark, standalone/cluster) can do on its own and together. It gave me ideas on how I should test my application on my local machine when I develop vs when it is deployed on a cluster.
Thomas Carcaud - IT Frankfurt GmbH
Course - Spark for Developers
Ajay was very friendly, helpful and also knowledgable about the topic he was discussing.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Course - Spark for Developers
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Course - Spark for Developers
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Course - Spark for Developers
We know a lot more about the whole environment.
John Kidd
Course - Spark for Developers
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.