Course Outline
Εισαγωγή
- Εισαγωγή στο Cloud Computing και λύσεις Big Data Επισκόπηση του Apache Hadoop Χαρακτηριστικά και Αρχιτεκτονική
Ρύθμιση Hadoop
- Σχεδιασμός συμπλέγματος Hadoop (on-premise, cloud, κ.λπ.) Επιλογή του λειτουργικού συστήματος και της διανομής Hadoop Πόρων παροχής (υλικό, δίκτυο, κ.λπ.) Λήψη και εγκατάσταση του λογισμικού Προσαρμογή μεγέθους του συμπλέγματος για ευελιξία
Εργασία με HDFS
- Κατανόηση του Hadoop Κατανεμημένου συστήματος αρχείων (HDFS) Επισκόπηση της αναφοράς εντολών HDFS Πρόσβαση στο HDFS Εκτέλεση βασικών λειτουργιών αρχείων σε HDFS χρησιμοποιώντας το S3 ως συμπλήρωμα του HDFS
Επισκόπηση του MapReduce
- Κατανόηση της ροής δεδομένων στο MapReduce Framework Map, Shuffle, Sort and Reduce Demo: Computing Top Salaries
Εργασία με YARN
- Κατανόηση της διαχείρισης πόρων στο Hadoop Εργασία με ResourceManager, NodeManager, Application Master Scheduling εργασίες στο YARN Scheduling για μεγάλους αριθμούς κόμβων και συμπλεγμάτων Επίδειξη: Προγραμματισμός εργασιών
Ενσωμάτωση Hadoop με το Spark
- Ρύθμιση χώρου αποθήκευσης για το Spark (HDFS, Amazon, S3, NoSQL, κ.λπ.) Κατανόηση Ελαστικών Κατανεμημένων Συνόλων Δεδομένων (RDD) Δημιουργία επίδειξης RDD Implementing RDD Transformations: Εφαρμογή προγράμματος αναζήτησης κειμένου για τίτλους ταινιών
Διαχείριση ενός συμπλέγματος Hadoop
- Παρακολούθηση Hadoop Ασφάλιση συμπλέγματος Hadoop Προσθήκη και αφαίρεση κόμβων Εκτέλεση σημείου αναφοράς απόδοσης Συντονισμός συμπλέγματος Hadoop για βελτιστοποίηση της απόδοσης Δημιουργία αντιγράφων ασφαλείας, ανάκτηση και σχεδιασμός επιχειρηματικής συνέχειας Διασφάλιση υψηλής διαθεσιμότητας (HA)
Αναβάθμιση και μετεγκατάσταση ενός Hadoop συμπλέγματος
- Αξιολόγηση απαιτήσεων φόρτου εργασίας Αναβάθμιση Hadoop Μετάβαση από εσωτερική εγκατάσταση στο cloud και αντίστροφα Ανάκτηση από αποτυχίες
Αντιμετώπιση προβλημάτων
Περίληψη και Συμπέρασμα
Requirements
- Εμπειρία διαχείρισης συστήματος
- Εμπειρία με τη γραμμή εντολών Linux
- Κατανόηση των εννοιών των μεγάλων δεδομένων
Ακροατήριο
- διαχειριστές συστήματος
- DBA
Testimonials (5)
Πολλά πρακτικά παραδείγματα, διαφορετικοί τρόποι προσέγγισης του ίδιου προβλήματος και μερικές φορές όχι τόσο προφανή κόλπα πώς να βελτιώσετε την τρέχουσα λύση
Rafal - Nordea
Course - Apache Spark MLlib
Machine Translated
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift