A Practical Introduction to Stream Processing Training Course
Stream Processing αναφέρεται στην Stream Processing σε πραγματικό χρόνο των "δεδομένων σε κίνηση", δηλαδή στην εκτέλεση υπολογισμών στα δεδομένα καθώς αυτά λαμβάνονται. Αυτά τα δεδομένα διαβάζονται ως συνεχείς ροές από πηγές δεδομένων όπως συμβάντα αισθητήρων, δραστηριότητα χρηστών ιστοτόπων, οικονομικά συναλλαγές, swipes πιστωτικών καρτών, ροές κλικ κλπ. Stream Processing πλαίσια Stream Processing είναι σε θέση να διαβάζουν μεγάλους όγκους εισερχόμενων δεδομένων και να παρέχουν πολύτιμες πληροφορίες σχεδόν στιγμιαία.
Σε αυτόν τον εκπαιδευτή, ζωντανή εκπαίδευση (onsite ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να δημιουργήσουν και να ενσωματώσουν διαφορετικά πλαίσια Stream Processing με υπάρχοντα μεγάλα συστήματα αποθήκευσης δεδομένων και συναφείς εφαρμογές λογισμικού και μικροεπιχειρήσεις.
Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Εγκαταστήστε και διαμορφώστε διαφορετικά πλαίσια Stream Processing , όπως Spark Streaming και Streaming Kafka.
- Κατανοήστε και επιλέξτε το καταλληλότερο πλαίσιο για την εργασία.
- Διαδικασία δεδομένων συνεχώς, ταυτόχρονα, και με τρόπο ρεκόρ ανά εγγραφή.
- Ενσωματώστε τις λύσεις Stream Processing με υπάρχουσες βάσεις δεδομένων, αποθήκες δεδομένων, λίμνες δεδομένων κλπ.
- Ενσωματώστε την πιο κατάλληλη βιβλιοθήκη επεξεργασίας ροής με επιχειρηματικές εφαρμογές και μικροεπιχειρήσεις.
Κοινό
- Προγραμματιστές
- Αρχιτέκτονες λογισμικού
Μορφή του μαθήματος
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
Σημειώσεις
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
Course Outline
Εισαγωγή
- Επεξεργασία ροής έναντι μαζικής επεξεργασίας Επεξεργασία ροής εστιασμένη στο Analytics
Επισκόπηση Πλαίσια και Programming Γλώσσες
- Spark Streaming (Scala) Kafka Streaming (Java) Flink Storm Σύγκριση χαρακτηριστικών και δυνατοτήτων κάθε πλαισίου
Επισκόπηση των πηγών δεδομένων
- Ζωντανά δεδομένα ως μια σειρά γεγονότων με την πάροδο του χρόνου Πηγές ιστορικών δεδομένων
Επιλογές ανάπτυξης
- Στο cloud (AWS, κ.λπ.) On premise (ιδιωτικό cloud, κ.λπ.)
Ξεκινώντας
- Ρύθμιση του περιβάλλοντος ανάπτυξης Εγκατάσταση και διαμόρφωση Αξιολόγηση των Data Analysis αναγκών σας
Λειτουργία ενός πλαισίου ροής
- Ενσωμάτωση του πλαισίου ροής με τα Big Data Tools Event Stream Processing (ESP) vs Complex Event Processing (CEP) Μετασχηματισμός των δεδομένων εισόδου Επιθεώρηση των δεδομένων εξόδου Ενοποίηση του πλαισίου Stream Processing με υπάρχουσες εφαρμογές και μικροϋπηρεσίες
Αντιμετώπιση προβλημάτων
Περίληψη και Συμπέρασμα
Requirements
- Programming εμπειρία σε οποιαδήποτε γλώσσα
- Κατανόηση των εννοιών Big Data (Hadoop, κ.λπ.)
Open Training Courses require 5+ participants.
A Practical Introduction to Stream Processing Training Course - Booking
A Practical Introduction to Stream Processing Training Course - Enquiry
A Practical Introduction to Stream Processing - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Upcoming Courses
Related Courses
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 HoursΑυτό το μάθημα απευθύνεται σε προγραμματιστές και επιστήμονες δεδομένων που θέλουν να κατανοήσουν και να εφαρμόσουν την τεχνητή νοημοσύνη στις εφαρμογές τους. Ιδιαίτερη έμφαση δίνεται στην ανάλυση δεδομένων, την κατανεμημένη τεχνητή νοημοσύνη και την επεξεργασία φυσικής γλώσσας.
Apache Kafka Connect
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να ενσωματώσουν το Apache Kafka με υπάρχουσες βάσεις δεδομένων και εφαρμογές για επεξεργασία, ανάλυση κ.λπ.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Χρησιμοποιήστε το Kafka Connect για να απορροφήσετε μεγάλες ποσότητες δεδομένων από μια βάση δεδομένων σε θέματα Kafka.
- Εισάγετε δεδομένα καταγραφής που δημιουργούνται από διακομιστές εφαρμογής σε θέματα Kafka.
- Διαθέστε τυχόν δεδομένα που συλλέγονται για επεξεργασία ροής.
- Εξαγωγή δεδομένων από θέματα του Κάφκα σε δευτερεύοντα συστήματα για αποθήκευση και ανάλυση.
Unified Batch and Stream Processing with Apache Beam
14 HoursΤο Apache Beam είναι ένα μοντέλο ανοιχτού κώδικα, ενοποιημένου προγραμματισμού για τον καθορισμό και την εκτέλεση παράλληλων αγωγών επεξεργασίας δεδομένων. Η δύναμή του έγκειται στην ικανότητά του να εκτελεί αγωγούς παρτίδας και ροής, με την εκτέλεση να εκτελείται από ένα από τα υποστηριζόμενα κατανεμημένα back-ends επεξεργασίας της Beam: Apache Apex, Apache Flink, Apache Spark και Google Cloud Dataflow. Το Apache Beam είναι χρήσιμο για εργασίες ETL (Extract, Transform, and Load), όπως η μετακίνηση δεδομένων μεταξύ διαφορετικών μέσων αποθήκευσης και πηγών δεδομένων, η μετατροπή δεδομένων σε μια πιο επιθυμητή μορφή και η φόρτωση δεδομένων σε ένα νέο σύστημα.
Σε αυτή τη ζωντανή εκπαίδευση (επί τόπου ή εξ αποστάσεως) υπό την καθοδήγηση εκπαιδευτών, οι συμμετέχοντες θα μάθουν πώς να εφαρμόζουν τα Apache Beam SDK σε μια εφαρμογή Java ή Python που ορίζει έναν αγωγό επεξεργασίας δεδομένων για την αποσύνθεση ενός μεγάλου συνόλου δεδομένων σε μικρότερα κομμάτια για ανεξάρτητη, παράλληλη επεξεργασία.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Apache Beam.
- Χρησιμοποιήστε ένα ενιαίο μοντέλο προγραμματισμού για να πραγματοποιήσετε επεξεργασία κατά παρτίδες και ροή μέσα από την εφαρμογή τους Java ή Python.
- Εκτελέστε αγωγούς σε πολλαπλά περιβάλλοντα.
Μορφή του μαθήματος
- Μέρος διάλεξη, μέρος συζήτηση, ασκήσεις και βαριά πρακτική εξάσκηση
Σημείωμα
- Αυτό το μάθημα θα είναι διαθέσιμο Scala στο μέλλον. Επικοινωνήστε μαζί μας για να κανονίσουμε.
Building Kafka Solutions with Confluent
14 Hoursαυτό εκπαιδευτής-LED, Live Training (επιτόπου ή εξ αποστάσεως) απευθύνεται σε μηχανικούς που επιθυμούν να αξιοποιήσουν (μια διανομή του Κάφκα) για την κατασκευή και τη διαχείριση ενός σε πραγματικό χρόνο πλατφόρμα επεξεργασίας δεδομένων για τις εφαρμογές τους.
μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- εγκαταστήσετε και να ρυθμίσετε τη σημαντική πλατφόρμα.
- χρήση & #39; s εργαλεία διαχείρισης και τις υπηρεσίες για να τρέξει Κάφκα πιο εύκολα.
- Αποθήκευση και επεξεργασία εισερχόμενων δεδομένων ροής.
- βελτιστοποιήσετε και να διαχειριστείτε Κάφκα συστάδες.
- ασφαλείς ροές δεδομένων.
μορφή του μαθήματος
- διαΔραστική διάλεξη και συζήτηση.
- πολλές ασκήσεις και εξάσκηση.
- hands-on εφαρμογή σε ένα περιβάλλον Live-Lab.
επιλογές προσαρμογής μαθημάτων
- αυτό το μάθημα βασίζεται στην έκδοση ανοικτού πηγαίου κώδικα της συνέχειας: ισχυρή ανοικτή πηγή.
- να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να κανονίσουμε.
Apache Flink Fundamentals
28 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) εισάγει τις αρχές και τις προσεγγίσεις πίσω από την κατανεμημένη επεξεργασία δεδομένων ροής και παρτίδας και καθοδηγεί τους συμμετέχοντες στη δημιουργία μιας εφαρμογής ροής δεδομένων σε πραγματικό χρόνο στο Apache Flink.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε ένα περιβάλλον για την ανάπτυξη εφαρμογών ανάλυσης δεδομένων.
- Κατανοήστε πώς λειτουργεί η βιβλιοθήκη επεξεργασίας γραφικών του Apache Flink (Gelly).
- Συσκευάστε, εκτελέστε και παρακολουθήστε εφαρμογές ροής δεδομένων που βασίζονται σε Flink, ανεκτικές σε σφάλματα.
- Διαχειριστείτε διαφορετικούς φόρτους εργασίας.
- Εκτελέστε προηγμένες αναλύσεις.
- Ρυθμίστε ένα σύμπλεγμα Flink πολλαπλών κόμβων.
- Μετρήστε και βελτιστοποιήστε την απόδοση.
- Ενσωματώστε το Flink με διαφορετικά Big Data συστήματα.
- Συγκρίνετε τις δυνατότητες του Flink με εκείνες άλλων πλαισίων επεξεργασίας μεγάλων δεδομένων.
Introduction to Graph Computing
28 HoursΣε αυτή τη ζωντανή εκπαίδευση στο Ελλάδα από εκπαιδευτές, οι συμμετέχοντες θα μάθουν για τις προσφορές τεχνολογίας και τις προσεγγίσεις υλοποίησης για την επεξεργασία δεδομένων γραφήματος. Ο στόχος είναι να προσδιοριστούν τα αντικείμενα του πραγματικού κόσμου, τα χαρακτηριστικά και οι σχέσεις τους, στη συνέχεια να μοντελοποιηθούν αυτές οι σχέσεις και να επεξεργαστούν ως δεδομένα χρησιμοποιώντας μια προσέγγιση Graph Computing (γνωστή και ως Graph Analytics). Ξεκινάμε με μια ευρεία επισκόπηση και περιορίζουμε τα συγκεκριμένα εργαλεία καθώς προχωράμε σε μια σειρά περιπτωσιολογικών μελετών, πρακτικών ασκήσεων και ζωντανών αναπτύξεων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε πώς διατηρούνται και διασχίζονται τα δεδομένα γραφήματος.
- Επιλέξτε το καλύτερο πλαίσιο για μια δεδομένη εργασία (από βάσεις δεδομένων γραφημάτων έως πλαίσια επεξεργασίας παρτίδας.)
- Εφαρμόστε τα Hadoop, Spark, GraphX και Pregel για να πραγματοποιήσετε υπολογισμούς γραφημάτων σε πολλές μηχανές παράλληλα.
- Δείτε τα προβλήματα μεγάλων δεδομένων του πραγματικού κόσμου όσον αφορά τα γραφήματα, τις διεργασίες και τις διαβάσεις.
Apache Kafka for Python Programmers
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε μηχανικούς δεδομένων, επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν τις δυνατότητες Apache Kafka στη ροή δεδομένων με το Python.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να χρησιμοποιούν το Apache Kafka για να παρακολουθούν και να διαχειρίζονται τις συνθήκες σε συνεχείς ροές δεδομένων χρησιμοποιώντας προγραμματισμό Python.
Stream Processing with Kafka Streams
7 HoursΤο Kafka Streams είναι μια βιβλιοθήκη πελάτη για την κατασκευή εφαρμογών και μικροεπιχειρήσεων, τα δεδομένα των οποίων μεταφέρονται προς και από ένα σύστημα ανταλλαγής μηνυμάτων Kafka. Παραδοσιακά, ο Apache Kafka έχει βασιστεί στο Apache Spark ή στη Apache Storm για να επεξεργάζεται δεδομένα μεταξύ παραγωγών μηνυμάτων και καταναλωτών. Καλώντας το API Streams Kafka από μια εφαρμογή, τα δεδομένα μπορούν να επεξεργαστούν απευθείας μέσα στο Kafka, παρακάμπτοντας την ανάγκη για την αποστολή των δεδομένων σε ένα ξεχωριστό σύμπλεγμα για επεξεργασία.
Σε αυτήν την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να ενσωματώσουν τις ροές του Kafka σε ένα σύνολο από Java εφαρμογές που μεταφέρουν δεδομένα από και προς τον Apache Kafka για επεξεργασία ρεύματος.
Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Κατανοήστε τα χαρακτηριστικά και τα πλεονεκτήματα του Kafka Streams σε σχέση με άλλα πλαίσια επεξεργασίας ρευμάτων
- Διαδικασία ροής δεδομένων απευθείας μέσα σε ένα σύμπλεγμα Kafka
- Γράψτε μια εφαρμογή Java ή Scala ή μια μικροεπιχειρησιακή υπηρεσία που ενσωματώνει τις ροές Kafka και Kafka
- Γράψτε τον συνοπτικό κωδικό που μετατρέπει τα θέματα εισαγωγής του Kafka σε θέματα Kafka εξόδου
- Δημιουργήστε, συσκευάστε και αναπτύξτε την εφαρμογή
Κοινό
- Προγραμματιστές
Μορφή του μαθήματος
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
Σημειώσεις
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε
Confluent KSQL
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να εφαρμόσουν Apache Kafka επεξεργασία ροής χωρίς να γράφουν κώδικα.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Confluent KSQL.
- Ρυθμίστε έναν αγωγό επεξεργασίας ροής χρησιμοποιώντας μόνο εντολές SQL (όχι κωδικοποίηση Java ή Python).
- Πραγματοποιήστε το φιλτράρισμα δεδομένων, τους μετασχηματισμούς, τις συναθροίσεις, τις συνδέσεις, τα παράθυρα και τη συνεδρία εξ ολοκλήρου στο SQL.
- Σχεδιάστε και αναπτύξτε διαδραστικά, συνεχή ερωτήματα για ροή ETL και αναλυτικά στοιχεία σε πραγματικό χρόνο.
Apache NiFi for Administrators
21 HoursΣε αυτή τη ζωντανή εκπαίδευση που καθοδηγείται από εκπαιδευτές στο Ελλάδα (επιτόπου ή απομακρυσμένα), οι συμμετέχοντες θα μάθουν πώς να αναπτύσσουν και να διαχειρίζονται το Apache NiFi σε ένα ζωντανό εργαστηριακό περιβάλλον.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και ρυθμίστε το Apachi NiFi.
- Προέλευση, μετατροπή και διαχείριση δεδομένων από διαφορετικές, κατανεμημένες πηγές δεδομένων, συμπεριλαμβανομένων βάσεων δεδομένων και λιμνών μεγάλων δεδομένων.
- Αυτοματοποιήστε τις ροές δεδομένων.
- Ενεργοποίηση αναλύσεων ροής.
- Εφαρμόστε διάφορες προσεγγίσεις για την απορρόφηση δεδομένων.
- Μετατρέψτε το Big Data και σε επιχειρηματικές γνώσεις.
Apache NiFi for Developers
7 HoursΣε αυτή τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν τις βασικές αρχές του προγραμματισμού που βασίζεται στη ροή καθώς αναπτύσσουν έναν αριθμό από επεκτάσεις επίδειξης, στοιχεία και επεξεργαστές χρησιμοποιώντας το Apache NiFi.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε την αρχιτεκτονική του NiFi και τις έννοιες ροής δεδομένων.
- Αναπτύξτε επεκτάσεις χρησιμοποιώντας NiFi και API τρίτων.
- Προσαρμοσμένα αναπτύσσουν τον δικό τους επεξεργαστή Apache Nifi.
- Απορροφήστε και επεξεργαστείτε δεδομένα σε πραγματικό χρόνο από διαφορετικές και ασυνήθιστες μορφές αρχείων και πηγές δεδομένων.
Python and Spark for Big Data (PySpark)
21 HoursΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark με το Python για την ανάλυση του Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Spark Streaming with Python and Kafka
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε μηχανικούς δεδομένων, επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν Spark Streaming δυνατότητες για την επεξεργασία και την ανάλυση δεδομένων σε πραγματικό χρόνο.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να χρησιμοποιούν το Spark Streaming για να επεξεργάζονται ζωντανές ροές δεδομένων για χρήση σε βάσεις δεδομένων, συστήματα αρχείων και ζωντανούς πίνακες εργαλείων.
Apache Spark MLlib
35 HoursΤο MLlib είναι η βιβλιοθήκη εκμάθησης μηχανών Spark (ML). Σκοπός του είναι να κάνει την πρακτική εκμάθηση μηχανών κλιμακωτή και εύκολη. Αποτελείται από κοινούς αλγόριθμους και βοηθητικά προγράμματα μάθησης, συμπεριλαμβανομένης της ταξινόμησης, της παλινδρόμησης, της ομαδοποίησης, του συνεργατικού φιλτραρίσματος, της μείωσης των διαστάσεων, καθώς και των πρωτόγονων βελτιστοποίησης χαμηλότερου επιπέδου και των API αγωγών υψηλότερου επιπέδου.
Διαχωρίζεται σε δύο πακέτα:
Το spark.mllib περιέχει το αρχικό API που είναι ενσωματωμένο στο RDD.
Το spark.ml παρέχει API υψηλότερου επιπέδου που είναι ενσωματωμένο στο DataFrames για την κατασκευή αγωγών ML.
Κοινό
Αυτό το μάθημα απευθύνεται σε μηχανικούς και προγραμματιστές που επιδιώκουν να χρησιμοποιήσουν μια ενσωματωμένη βιβλιοθήκη μηχανών για Apache Spark