Course Outline

Εισαγωγή

Κατανόηση Big Data

Επισκόπηση του Spark

Επισκόπηση του Python

Επισκόπηση του PySpark

  • Διανομή δεδομένων με χρήση του Resilient Distributed Datasets Framework
  • Κατανομή υπολογισμού με χρήση τελεστών Spark API

Ρύθμιση Python με Spark

Ρύθμιση PySpark

Χρήση Amazon Web Services (AWS) EC2 Instances για Spark

Ρύθμιση Databricks

Ρύθμιση του συμπλέγματος AWS EMR

Εκμάθηση των Βασικών του Python Programming

  • Ξεκινώντας με το Python
  • Χρήση του σημειωματάριου Jupyter
  • Χρήση μεταβλητών και απλών τύπων δεδομένων
  • Εργασία με λίστες
  • Χρησιμοποιώντας τις δηλώσεις if
  • Χρήση εισόδων χρήστη
  • Εργασία με τους βρόχους while
  • Λειτουργίες υλοποίησης
  • Εργασία με Τάξεις
  • Εργασία με αρχεία και εξαιρέσεις
  • Εργασία με έργα, δεδομένα και API

Μαθαίνοντας τα βασικά του Spark DataFrame

  • Ξεκινώντας με το Spark DataFrames
  • Υλοποίηση Βασικών Λειτουργιών με Spark
  • Χρήση Groupby και Συγκεντρωτικών Λειτουργιών
  • Εργασία με χρονικές σημάνσεις και ημερομηνίες

Εργασία σε μια άσκηση έργου Spark DataFrame

Κατανόηση Machine Learning με το MLlib

Εργασία με MLlib, Spark και Python για Machine Learning

Κατανόηση των παλινδρομήσεων

  • Εκμάθηση της Θεωρίας Γραμμικής Παλινδρόμησης
  • Εφαρμογή Κώδικα Αξιολόγησης Παλινδρόμησης
  • Εργασία σε ένα δείγμα άσκησης γραμμικής παλινδρόμησης
  • Εκμάθηση Λογιστικής Παλινδρόμησης Θεωρίας
  • Εφαρμογή Κώδικα Logistic Regression
  • Εργασία σε ένα δείγμα άσκησης λογιστικής παλινδρόμησης

Κατανόηση Random Forests και Decision Trees

  • Θεωρία μεθόδων μάθησης δέντρου
  • Δένδρα αποφάσεων εφαρμογής και Random Forest Κώδικες
  • Εργασία σε ένα δείγμα Random Forest Άσκηση ταξινόμησης

Εργασία με K-means Clustering

  • Κατανόηση της Θεωρίας Clustering K-means
  • Εφαρμογή Κώδικα Ομαδοποίησης K-means
  • Εργασία σε μια άσκηση δειγματοληψίας ομαδοποίησης

Εργασία με Συστήματα Recommender

Εφαρμογή Επεξεργασίας Φυσικής Γλώσσας

  • Κατανόηση Natural Language Processing (NLP)
  • Επισκόπηση των εργαλείων NLP
  • Εργασία σε ένα δείγμα άσκησης NLP

Streaming with Spark στο Python

  • Επισκόπηση Ροή με Spark
  • Δείγμα Spark Streaming Άσκηση

Τελευταία σχόλια

Requirements

  • Γενικές δεξιότητες προγραμματισμού

Ακροατήριο

  • προγραμματιστές
  • Επαγγελματίες Πληροφορικής
  • Επιστήμονες Δεδομένων
 21 Hours

Number of participants


Price per participant

Testimonials (6)

Upcoming Courses

Related Categories