Course Outline

spark.mllib: τύποι δεδομένων, αλγόριθμοι και βοηθητικά προγράμματα

  • Τύποι δεδομένων
  • Βασικά στατιστικά στοιχεία
    • συνοπτικά στατιστικά στοιχεία
    • συσχετίσεις
    • στρωματοποιημένη δειγματοληψία
    • δοκιμή υποθέσεων
    • δοκιμή σημασίας ροής
    • τυχαία παραγωγή δεδομένων
  • Ταξινόμηση και παλινδρόμηση
    • γραμμικά μοντέλα (SVM, λογιστική παλινδρόμηση, γραμμική παλινδρόμηση)
    • αφελής Bayes
    • δέντρα απόφασης
    • σύνολα δέντρων (Random Forests και Gradient-Boosted Trees)
    • ισοτονική παλινδρόμηση
  • Συνεργατικό φιλτράρισμα
    • εναλλασσόμενα ελάχιστα τετράγωνα (ALS)
  • Ομαδοποίηση
    • κ-μέσος
    • Gaussian μείγμα
    • ομαδοποίηση επανάληψης ισχύος (PIC)
    • λανθάνουσα κατανομή Dirichlet (LDA)
    • διχοτόμηση k-means
    • streaming k-means
  • Μείωση διαστάσεων
    • αποσύνθεση μοναδικής τιμής (SVD)
    • ανάλυση κύριου συστατικού (PCA)
  • Εξαγωγή και μετασχηματισμός χαρακτηριστικών
  • Συχνή εξόρυξη προτύπων
    • FP-ανάπτυξη
    • κανόνες ένωσης
    • PrefixSpan
  • Μετρήσεις αξιολόγησης
  • Εξαγωγή μοντέλου PMML
  • Βελτιστοποίηση (προγραμματιστής)
    • στοχαστική κλίση κάθοδος
    • περιορισμένης μνήμης BFGS (L-BFGS)

spark.ml: API υψηλού επιπέδου για αγωγούς ML

  • Επισκόπηση: εκτιμητές, μετασχηματιστές και αγωγοί
  • Εξαγωγή, μετατροπή και επιλογή χαρακτηριστικών
  • Ταξινόμηση και παλινδρόμηση
  • Ομαδοποίηση
  • Προχωρημένα θέματα

Requirements

Γνώση ενός από τα ακόλουθα:

  • Ιάβα
  • Scala
  • Πύθων
  • SparkR.
 35 Hours

Number of participants


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories