Course Outline
- Machine Learning εισαγωγή
- Τύποι μηχανικής μάθησης – εποπτευόμενη έναντι μη εποπτευόμενης μάθησης
- Από τη στατιστική μάθηση στη μηχανική μάθηση
- Η ροή εργασίας Data Mining:
- Business κατανόηση
- Κατανόηση Δεδομένων
- Προετοιμασία δεδομένων
- Πρίπλασμα
- Εκτίμηση
- Ανάπτυξη
- Αλγόριθμοι μηχανικής μάθησης
- Επιλέγοντας τον κατάλληλο αλγόριθμο για το πρόβλημα
- Αντιστάθμιση υπερπροσαρμογής και μεροληψίας-διακύμανσης στο ML
- Βιβλιοθήκες ML και γλώσσες προγραμματισμού
- Γιατί να χρησιμοποιήσετε μια γλώσσα προγραμματισμού
- Επιλογή μεταξύ R και Python
- Python πορεία συντριβής
- Python πόρους
- Python Βιβλιοθήκες για Μηχανική Εκμάθηση
- Σημειωματάρια Jupyter και διαδραστική κωδικοποίηση
- Δοκιμή αλγορίθμων ML
- Γενίκευση και υπερπροσαρμογή
- Αποφυγή υπερβολικής τοποθέτησης
- Μέθοδος κράτησης
- Διασταυρωμένη επικύρωση
- Bootstrapping
- Αξιολόγηση αριθμητικών προβλέψεων
- Μέτρα ακρίβειας: ME, MSE, RMSE, MAPE
- Σταθερότητα παραμέτρων και πρόβλεψης
- Αξιολόγηση αλγορίθμων ταξινόμησης
- Η ακρίβεια και τα προβλήματά της
- Η μήτρα σύγχυσης
- Πρόβλημα μη ισορροπημένων τάξεων
- Οπτικοποίηση της απόδοσης του μοντέλου
- Καμπύλη κέρδους
- Καμπύλη ROC
- Καμπύλη ανύψωσης
- Επιλογή μοντέλου
- Συντονισμός μοντέλου – στρατηγικές αναζήτησης πλέγματος
- Παραδείγματα στο Python
- Προετοιμασία δεδομένων
- Εισαγωγή και αποθήκευση δεδομένων
- Κατανόηση των δεδομένων – βασικές εξερευνήσεις
- Χειρισμοί δεδομένων με τη βιβλιοθήκη pandas
- Μετασχηματισμοί δεδομένων – Διαμάχη δεδομένων
- Διερευνητική ανάλυση
- Παρατηρήσεις που λείπουν – ανίχνευση και λύσεις
- Outliers – εντοπισμός και στρατηγικές
- Τυποποίηση, κανονικοποίηση, δυαδοποίηση
- Ποιοτική επανακωδικοποίηση δεδομένων
- Παραδείγματα στο Python
- Ταξινόμηση
- Ταξινόμηση δυαδικής έναντι πολλαπλών κλάσεων
- Ταξινόμηση μέσω μαθηματικών συναρτήσεων
- Συναρτήσεις γραμμικής διάκρισης
- Συναρτήσεις τετραγωνικής διάκρισης
- Λογιστική παλινδρόμηση και προσέγγιση πιθανοτήτων
- k-πλησιέστεροι γείτονες
- Ο αφελής Bayes
- Δέντρα απόφασης
- ΚΑΡΟΤΣΑΚΙ
- Σακκόπανο
- Random Forests
- Ενίσχυση
- Xgboost
- Υποστήριξη διανυσματικών μηχανών και πυρήνων
- Ταξινομητής μέγιστου περιθωρίου
- Υποστήριξη διανυσματική μηχανή
- Εκμάθηση συνόλου
- Παραδείγματα στο Python
- Παλινδρόμηση και αριθμητική πρόβλεψη
- Εκτίμηση ελάχιστων τετραγώνων
- Τεχνικές επιλογής μεταβλητών
- Τακτοποίηση και σταθερότητα- L1, L2
- Μη γραμμικότητες και γενικευμένα ελάχιστα τετράγωνα
- Πολυωνυμική παλινδρόμηση
- Σφαιρίδια παλινδρόμησης
- Δέντρα παλινδρόμησης
- Παραδείγματα στο Python
- Εκμάθηση χωρίς επίβλεψη
- Ομαδοποίηση
- Centroid-based clustering – k-means, k-medoids, PAM, CLARA
- Ιεραρχική ομαδοποίηση – Diana, Agnes
- Ομαδοποίηση βάσει μοντέλου - EM
- Αυτοοργάνωση χαρτών
- Αξιολόγηση και αξιολόγηση ομάδων
- Μείωση διαστάσεων
- Ανάλυση κύριας συνιστώσας και παραγοντική ανάλυση
- Αποσύνθεση μοναδικής τιμής
- Πολυδιάστατη Κλιμάκωση
- Παραδείγματα στο Python
- Ομαδοποίηση
- Εξόρυξη κειμένου
- Προεπεξεργασία δεδομένων
- Το μοντέλο της τσάντας των λέξεων
- Στέλεχος και λεμμοποίηση
- Αναλύοντας τις συχνότητες των λέξεων
- Ανάλυση συναισθήματος
- Δημιουργία σύννεφων λέξεων
- Παραδείγματα στο Python
- Μηχανές συστάσεων και συνεργατικό φιλτράρισμα
- Δεδομένα σύστασης
- Συνεργατικό φιλτράρισμα βάσει χρήστη
- Συνεργατικό φιλτράρισμα βάσει στοιχείων
- Παραδείγματα στο Python
- Εξόρυξη προτύπων συσχέτισης
- Αλγόριθμος συχνών συνόλων στοιχείων
- Ανάλυση καλαθιού αγοράς
- Παραδείγματα στο Python
- Outlier Analysis
- Ανάλυση ακραίας αξίας
- Ανίχνευση ακραίων τιμών με βάση την απόσταση
- Μέθοδοι που βασίζονται στην πυκνότητα
- Ανίχνευση ακραίων υψηλών διαστάσεων
- Παραδείγματα στο Python
- Machine Learning μελέτη περίπτωσης
- Business κατανόηση του προβλήματος
- Προεπεξεργασία δεδομένων
- Επιλογή και συντονισμός αλγορίθμου
- Αξιολόγηση ευρημάτων
- Ανάπτυξη
Requirements
Γνώση και επίγνωση των Machine Learning βασικών
Testimonials (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback