Performing Data Engineering on Microsoft HD Insight (20775)

SQL Server / Big Data

Introductie

Leer dataflows te maken met HDInsight.

Algemene omschrijving

The main purpose of the course is to give students the ability plan and implement big data workflows on HDInsight.

Leerdoelen

After completing this course, students will be able to:

  • Deploy HDInsight Clusters.
  • Authorizing Users to Access Resources.
  • Loading Data into HDInsight.
  • Troubleshooting HDInsight.
  • Implement Batch Solutions.
  • Design Batch ETL Solutions for Big Data with Spark
  • Analyze Data with Spark SQL.
  • Analyze Data with Hive and Phoenix.
  • Describe Stream Analytics.
  • Implement Spark Streaming Using the DStream API.
  • Develop Big Data Real-Time Processing Solutions with Apache Storm.
  • Build Solutions that use Kafka and HBase.

Doelgroep

The primary audience for this course is data engineers, data architects, data scientists, and data developers who plan to implement big data engineering workflows on HDInsight.

Voorkennis

In addition to their professional experience, students who attend this course should have:

  • Programming experience using R, and familiarity with common R packages

  • Knowledge of common statistical methods and data analysis best practices.

  • Basic knowledge of the Microsoft Windows operating system and its core functionality.

  • Working knowledge of relational databases.

Methode

StarTel verzorgt (maatwerk) ICT-trainingen op locatie in Roden of in-company in heel Nederland. Onze gecertificeerde trainers hebben veel praktische ervaring met de producten waarvoor zij trainingen verzorgen. Door de praktische benadering is de opgedane kennis na afloop van de training direct toepasbaar. Daarnaast worden de cursisten door onze trainers optimaal voorbereid op de afsluitende certificeringen en examens.
Bij StarTel kunt u zich inschrijven voor zowel klassikale trainingen als individuele (maatwerk) trainingen.
 

Module 1: Getting Started with HDInsight
Module 2: Deploying HDInsight Clusters
Module 3: Authorizing Users to Access Resources
Module 4: Loading data into HDInsight
Module 5: Troubleshooting HDInsight
Module 6: Implementing Batch Solutions
|Module 7: Design Batch ETL solutions for big data with Spark
Module 8: Analyze Data with Spark SQL
Module 9: Analyze Data with Hive and Phoenix
Module 10: Stream Analytics
Module 11: Implementing Streaming Solutions with Kafka and HBase
Module 12: Develop big data real-time processing solutions with Apache Storm
Module 13: Create Spark Streaming Applications

Staat bij deze training geen datum gepland die in je planning past, kies dan voor de flexibele inschrijving. Wij nemen dan contact met je op. We kijken graag samen met je naar een mogelijk andere datum of andere lesmethode om je te voorzien in je trainingsbehoefte.

Startdatum Maand Variant Locatie

Abonneer je op onze e-maillijst en ontvang updates over onze trainingen en acties.

Je kunt je op elk moment weer uitschrijven.

StarTel, where Stars are born.