Apache Spark Advanced Topics - Apache - Apache Spark - Big Data
Verrijk uw carrière met OEM’s
ICT-Trainingen
Beoordeeld met een 9,0 – een van de best gewaardeerde ICT-opleiders
van Nederland.
Waarom OEM?
- Meer dan 20 jaar ervaring in ICT-trainingen
- Ruim 1000 cursussen van 200 topmerken
- Gecertificeerde docenten & bekroonde e-learning
- Officiële partner van Microsoft, EC-Council, Certiport en Pearson VUE
- Flexibele leervormen: klassikaal, online, e-learning of blended
Start vandaag nog en ontwikkel uzelf of uw team met een training die écht resultaat oplevert.
Let op: bij het aanvragen van informatie vragen wij om een telefoonnummer, zodat wij u snel en persoonlijk kunnen adviseren.
Na inschrijving van de Award Winning E-learning training Apache Spark Advanced Topics, ontvangt u per e-mail een link om in te loggen in uw leeromgeving waar u een persoonlijk wachtwoord aanmaakt. Eenmaal ingelogd in uw persoonlijke leeromgeving ziet u een overzicht van de cursusonderdelen. Via de inhoudsopgave schakelt u automatisch over naar elk gewenst onderdeel van de training.
Er zit tevens een Voortgangsbewaking bij om eenvoudig te zien hoe ver u bent binnen uw training. U kunt daarbij 1 jaar lang (365 dagen), 24/7 (elke dag en nacht) inloggen om verder te gaan met de training.
Deze Engelstalige training met ondertiteling heeft interactieve, eenvoudig te volgen video's in HD beeldkwa…
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
Verrijk uw carrière met OEM’s
ICT-Trainingen
Beoordeeld met een 9,0 – een van de best gewaardeerde ICT-opleiders
van Nederland.
Waarom OEM?
- Meer dan 20 jaar ervaring in ICT-trainingen
- Ruim 1000 cursussen van 200 topmerken
- Gecertificeerde docenten & bekroonde e-learning
- Officiële partner van Microsoft, EC-Council, Certiport en Pearson VUE
- Flexibele leervormen: klassikaal, online, e-learning of blended
Start vandaag nog en ontwikkel uzelf of uw team met een training die écht resultaat oplevert.
Let op: bij het aanvragen van informatie vragen wij om een telefoonnummer, zodat wij u snel en persoonlijk kunnen adviseren.
Na inschrijving van de Award Winning E-learning training Apache Spark Advanced Topics, ontvangt u per e-mail een link om in te loggen in uw leeromgeving waar u een persoonlijk wachtwoord aanmaakt. Eenmaal ingelogd in uw persoonlijke leeromgeving ziet u een overzicht van de cursusonderdelen. Via de inhoudsopgave schakelt u automatisch over naar elk gewenst onderdeel van de training.
Er zit tevens een Voortgangsbewaking bij om eenvoudig te zien hoe ver u bent binnen uw training. U kunt daarbij 1 jaar lang (365 dagen), 24/7 (elke dag en nacht) inloggen om verder te gaan met de training.
Deze Engelstalige training met ondertiteling heeft interactieve, eenvoudig te volgen video's in HD beeldkwaliteit met heldere audio kwaliteit. Daarnaast biedt de training Support en/of een Online Mentor aan als u problemen ondervindt. De training is beschikbaar in elke browser voor zowel PC, Mac, Tablet én Smartphone. Dus zelfs via uw mobiel kunt u handig de training volgen.
De training is inclusief lees- en/of praktijkopdrachten met trainingstest, mits noodzakelijk voor de training. Na afronding van de training krijgt u een Certificaat van Deelname en sluit u zich aan bij de reeds duizenden tevreden cursisten.
Apache Spark is een open source framework voor big data-verwerking dat is gebouwd rond snelheid, gebruiksgemak en geavanceerde analyses. In dit leertraject leer je over de meer geavanceerde functies van Spark Core, Spark Streaming, Spark SQL, MLlib, GraphX en SparkR.
Cursusinhoud
Spark RDDs
Course: 1 Hour, 13 Minutes
- Course Introduction
- Review of Spark Stack
- Defining Lazy Evaluation
- Examining RDD Lineage
- Pre-partitioning RDDs
- Storing RDDs in Serialized Form
- Performing Numeric Operations
- Creating Custom Accumulators
- Optimizing Broadcasts
- Piping to External Applications
- Tuning Garbage Collection
- Performing Batch Importing
- Determining Memory Consumption
- Tuning Data Structures
- Minimizing Memory Usage of Reduce Tasks
- Setting the Levels of Parallelism
Data Frames and Spark SQL
Course: 43 Minutes
- Creating DataFrames
- Interoperating with RDDs
- Examining the Load and Save Functions
- Reading and Writing Parquet Files
- Using JSON Dataset as a DataFrame
- Reading and Writing Data in Hive Tables
- Reading and Writing Data Using JDBC
- Running Thrift JDBC/ODBC Server
Practice: Tuning Spark
Course: 9 Minutes
Streaming Analytics
Course: 54 Minutes
- Course Introduction
- Examining Discretized Streams
- Ingesting TCP Socket Input Streams
- Reading File Input Streams
- Receiving Akka Actor Input Streams
- Consuming Kafka Input Streams
- Ingesting Flume Input Streams
- Setting Up Kinesis Input Streams
- Configuring Twitter Input Streams
- Implementing Custom Input Streams
- Describing Receiver Reliability
Transformations on DStreams
Course: 1 Hour, 19 Minutes
- Using UpdateStateByKey Operations
- Performing Transform Operations
- Performing Window Operations
- Performing Join Operations
- Using Output Operations on DStreams
- Using Data Frames and SQL Operations
- Using Learning Algorithms with MLlib
- Persisting Stream Data in Memory
- Enabling and Configuring Checkpointing
- Deploying Applications
- Monitoring Applications
- Reducing Batch Processing Times
Performance Tuning
Course: 19 Minutes
- Setting Batch Intervals
- Tuning Memory Usage
- Examining the Semantics of Fault Tolerance
Practice: Transformations on Dstreams
Course: 6 Minutes
- Exercise: Perform Transformations on DStreams
Machine Learning with MLlib
Course: 1 Hour, 12 Minutes
- Course Introduction
- Describing Data Types
- Examining Basic Statistics
- Exploring Linear SVMs
- Performing Logistic Regression
- Using Naive Bayes
- Creating Decision Trees
- Using Collaborative Filtering with ALS
- Clustering with K-means
- Clustering with Latent Dirichlet Allocation (LDA)
- Analyzing with Frequent Pattern Mining
GraphX
Course: 57 Minutes
- Examining the Property Graph
- Exploring the Graph Operators
- Performing Analytics with Neighborhood Aggregation
- Messaging with Pregel API
- Building Graphs
- Examining Vertex and Edge RDDs
- Optimizing Representation Through Partitioning
- Measuring Vertices with PageRank
R and Spark
Course: 37 Minutes
- Installing SparkR
- Running SparkR
- Using Existing R Packages
- Exposing RDDs as Distributed Lists
- Interoperating with DataFrames
- Using Parquet Files
- Running on a Cluster
Practice: Use MLlib
Course: 10 Minutes
- Exercise: Use MLlib
Specificaties
Taal: Engels
Kwalificaties van de
Instructeur: Gecertificeerd
Cursusformaat en Lengte: Lesvideo's met
ondertiteling, interactieve elementen en opdrachten en testen
Lesduur: 7:42 uur
Voortgangsbewaking: Ja
Toegang tot Materiaal: 365 dagen
Technische Vereisten: Computer of mobiel
apparaat, Stabiele internetverbindingen Webbrowserzoals Chrome,
Firefox, Safari of Edge.
Support of Ondersteuning: Helpdesk en online
kennisbank 24/7
Certificering: Certificaat van deelname in
PDF formaat
Prijs en Kosten: Cursusprijs zonder extra
kosten
Annuleringsbeleid en Geld-Terug-Garantie: Wij
beoordelen dit per situatie
Award Winning E-learning: Ja
Tip! Zorg voor een rustige leeromgeving, tijd
en motivatie, audioapparatuur zoals een koptelefoon of luidsprekers
voor audio, accountinformatie zoals inloggegevens voor toegang tot
het e-learning platform.
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.







