Course Outline

Εισαγωγή στο Reinforcement Learning

  • Επισκόπηση της ενισχυτικής μάθησης και των εφαρμογών της
  • Διαφορές μεταξύ εποπτευόμενης, χωρίς επίβλεψη και ενισχυτικής μάθησης
  • Βασικές έννοιες: πράκτορας, περιβάλλον, ανταμοιβές και πολιτική

Markov Decision Processes (MDPs)

  • Κατανόηση καταστάσεων, ενεργειών, ανταμοιβών και μεταβάσεων καταστάσεων
  • Συναρτήσεις τιμής και η εξίσωση Bellman
  • Δυναμικός προγραμματισμός για την επίλυση MDP

Αλγόριθμοι πυρήνα RL

  • Πίνακες μέθοδοι: Q-Learning και SARSA
  • Μέθοδοι που βασίζονται σε πολιτικές: Αλγόριθμος REINFORCE
  • Τα πλαίσια ηθοποιών-κριτικών και οι εφαρμογές τους

Βαθύ Reinforcement Learning

  • Εισαγωγή στα Deep Q-Networks (DQN)
  • Ζήστε την εμπειρία αναπαραγωγής και στόχευσης δικτύων
  • Διαβαθμίσεις πολιτικής και προηγμένες μέθοδοι βαθιάς RL

RL Frameworks and Tools

  • Εισαγωγή στο OpenAI Γυμναστήριο και άλλα περιβάλλοντα RL
  • Χρήση PyTorch ή TensorFlow για ανάπτυξη μοντέλων RL
  • Εκπαίδευση, δοκιμή και συγκριτική αξιολόγηση πρακτόρων RL

Προκλήσεις στο RL

  • Εξισορρόπηση εξερεύνησης και εκμετάλλευσης στην εκπαίδευση
  • Αντιμετώπιση αραιών ανταμοιβών και προβλημάτων ανάθεσης πιστώσεων
  • Scalaικανότητα και υπολογιστικές προκλήσεις στο RL

Hands-On Activities

  • Εφαρμογή των αλγορίθμων Q-Learning και SARSA από την αρχή
  • Εκπαίδευση ενός πράκτορα που βασίζεται στο DQN για να παίξει ένα απλό παιχνίδι στο OpenAI Gym
  • Βελτιστοποιήστε τα μοντέλα RL για βελτιωμένη απόδοση σε προσαρμοσμένα περιβάλλοντα

Περίληψη και Επόμενα Βήματα

Requirements

  • Ισχυρή κατανόηση των αρχών και των αλγορίθμων μηχανικής μάθησης
  • Ικανότητα στον προγραμματισμό Python
  • Εξοικείωση με τα νευρωνικά δίκτυα και τα πλαίσια βαθιάς μάθησης

Ακροατήριο

  • Μηχανικοί μηχανικής εκμάθησης
  • Ειδικοί τεχνητής νοημοσύνης
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories