Course Outline

Εισαγωγή στα Data Analysis και Big Data

  • Τι κάνει το Big Data "Μεγάλο";
    • Ταχύτητα, Όγκος, Ποικιλία, Αλήθεια (VVVV)
  • Όρια στην παραδοσιακή επεξεργασία δεδομένων
  • Κατανεμημένη Επεξεργασία
  • Στατιστική ανάλυση
  • Τύποι Machine Learning Ανάλυσης
  • Data Visualization

Big Data Ρόλοι και Ευθύνες

  • Διαχειριστές
  • προγραμματιστές
  • Αναλυτές Δεδομένων

Languages Χρησιμοποιήθηκε για Data Analysis

  • R Language
    • Γιατί το R για το Data Analysis;
    • Χειρισμός δεδομένων, υπολογισμός και γραφική απεικόνιση
  • Python
    • Γιατί Python για Data Analysis;
    • Χειρισμός, επεξεργασία, καθαρισμός και σύνθλιψη δεδομένων

Προσεγγίσεις στο Data Analysis

  • Στατιστική ανάλυση
    • Ανάλυση χρονοσειρών
    • Forecasting με μοντέλα συσχέτισης και παλινδρόμησης
    • Συμπερασματικά Statistics (εκτίμηση)
    • Περιγραφικό Statistics σε Big Data σύνολα (π.χ. υπολογισμός μέσου όρου)
  • Machine Learning
    • Επίβλεψη έναντι μη εποπτευόμενης μάθησης
    • Ταξινόμηση και ομαδοποίηση
    • Εκτίμηση κόστους συγκεκριμένων μεθόδων
    • Φιλτράρισμα
  • Επεξεργασία Φυσικής Γλώσσας
    • Επεξεργασία κειμένου
    • Κατανόηση του νοήματος του κειμένου
    • Αυτόματη δημιουργία κειμένου
    • Ανάλυση συναισθήματος / ανάλυση θέματος
  • Computer Vision
    • Απόκτηση, επεξεργασία, ανάλυση και κατανόηση εικόνων
    • Ανακατασκευή, ερμηνεία και κατανόηση τρισδιάστατων σκηνών
    • Χρήση δεδομένων εικόνας για λήψη αποφάσεων

Big Data Υποδομή

  • Αποθήκευση δεδομένων
    • Σχεσιακές βάσεις δεδομένων (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Μη σχεσιακές βάσεις δεδομένων (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Κατανόηση των αποχρώσεων
      • Ιεραρχικές βάσεις δεδομένων
      • Αντικειμενοστρεφείς βάσεις δεδομένων
      • Βάσεις δεδομένων προσανατολισμένες στα έγγραφα
      • Βάσεις δεδομένων προσανατολισμένες σε γραφήματα
      • Αλλος
  • Κατανεμημένη Επεξεργασία
    • Hadoop
      • Το HDFS ως κατανεμημένο σύστημα αρχείων
      • MapReduce για κατανεμημένη επεξεργασία
    • Σπίθα
      • Πλαίσιο υπολογιστών συμπλέγματος όλα σε ένα στη μνήμη για επεξεργασία δεδομένων μεγάλης κλίμακας
      • Δομημένη ροή
      • Spark SQL
      • Machine Learning βιβλιοθήκες: MLlib
      • Επεξεργασία γραφήματος με GraphX
  • Scalaικανότητα
    • Δημόσιο σύννεφο
      • AWS, Google, Aliyun, κ.λπ.
    • Ιδιωτικό σύννεφο
      • OpenStack, Cloud Foundry, κ.λπ.
    • Αυτόματη επεκτασιμότητα

Επιλέγοντας τη σωστή λύση για το πρόβλημα

Το μέλλον του Big Data

Περίληψη και Επόμενα Βήματα

Requirements

  • Μια γενική κατανόηση των μαθηματικών
  • Μια γενική κατανόηση του προγραμματισμού
  • Μια γενική κατανόηση των βάσεων δεδομένων

Ακροατήριο

  • Προγραμματιστές / προγραμματιστές
  • σύμβουλοι πληροφορικής
 35 Hours

Number of participants


Price per participant

Testimonials (7)

Upcoming Courses

Related Categories