Data Engineering with Azure Databricks

In de training "Data Engineering with Azure Databricks" gaan we twee dagen lang aan de slag met Databricks om een Data Lakehouse te bouwen.

  • Offerte aanvragen

    Offerte aanvraag training

    Vul hier al je gegevens in waarvoor je een offerte wilt ontvangen.

    "*" geeft vereiste velden aan

    Vul hier jouw naam in*
    Zou je hieronder de informatie die we nodig hebben willen invullen? Denk aan het aantal deelnemers voor de offerte, eventuele specifieke wensen, en dergelijke.
    x
  • Download brochure
[springest]
  • Lorem
  • Lorem
  • Lorem

Incompany training?

Liever een training op eigen locatie? Ook dan is maatwerk een vanzelfsprekende optie. We creëren aangepaste trainingen die voldoen aan de specifieke behoeften en uitdagingen van jullie organisatie. Vraag hieronder een offerte aan voor een incompany training!

Vraag offerte aan

Offerte incompany

Vul hier al je gegevens in waarvoor je een offerte wilt ontvangen.

"*" geeft vereiste velden aan

Vul hier jouw naam in*
Zou je hieronder de informatie die we nodig hebben willen invullen? Denk aan het aantal deelnemers voor de offerte, eventuele specifieke wensen, en dergelijke.
x

Algemene omschrijving

In de training "Data Engineering with Azure Databricks" gaan we twee dagen lang aan de slag met Databricks om een Data Lakehouse te bouwen. Het hele spectrum komt hierin voorbij: architectuur en ontwerp, inrichting van Databricks, Implementatie van transformaties, orchestratie van je taken, versiebeheer en alles wat er meer nodig is voor je Data Lakehouse. Aan het eind van de training ben je in staat om zelfstandig een Data Lakehouse op te zetten binnen Databricks.

Doelgroep

Deze training is primair gericht op Data Engineers en Data Warehouse-ontwikkelaars of -beheerders die ervaring hebben met Data Warehousing of andere vormen van (batch) data processing. Deelnemers weten dat zij zich meer willen verdiepen in Databricks en het bouwen van een Data Lakehouse. De meeste deelnemers hebben al wel enige ervaring met cloudomgevingen, maar het is niet verplicht: ook wanneer je bijvoorbeeld van een on-premises Data Warehouse de stap aan het maken bent naar een Data Lakehouse sluit deze training goed aan.

Leerdoelen

Na afloop van deze training:

  • Weet je hoe de architectuur van een Data Lakehouse eruit ziet en werkt
  • Snap je de principes van Databricks, Data Lakehouses en Delta Lake
  • Kun je Databricks zelfstandig inrichten t.b.v. een Data Lakehouse
  • Begrijp je hoe Delta Lake Storage werkt en hoe het een Data Lakehouse mogelijk maakt
  • Kun je bestanden in je Data Lake beheren met behulp van Databricks
  • Kun je orchestratie binnen Databricks doen met behulp van jobs
  • Weet je welke lagen er in een Data Lakehouse bestaan en hoe je data uit jouw praktijk hier kunt laten landen
  • Kun je transformatie en integratie op de data doen in Databricks met behulp van PySpark en SparkSQL
  • Weet je hoe om te gaan met schema's en schema-evolutie

Voorkennis

Om deel te nemen aan deze training is het belangrijk dat je voorkennis hebt over de volgende onderwerpen:

  • Basiskennis van SQL:
    • Query-concepten (SELECT, WHERE, GROUP BY, ORDER BY, LIMIT en JOIN)
    • DDL (CREATE, ALTER, DROP van tabellen en databases)
    • DML (DELETE, INSERT, UPDATE, MERGE)
  • Kennis van Data Engineering in de cloud (VM's, storage accounts, AD-accounts, etc.)
  • Basiskennis van Python (modules, data inlezen, eenvoudige bewerkingen)

Onderwerpen

  • Data Lakes en Data Warehouses
  • Delta Lake
  • ETL met Spark SQL
  • Python en Spark SQL
  • Incrementele dataverwerking met Structured Streaming en Auto Loader
  • Data Lakehouse architectuur: de "medallions" (gold, silver, bronze)
  • Delta Live Tables
  • Orkestratie met Jobs
  • Databricks SQL
  • Rechtenbeheer
  • Dashboards en queries in productie brengen
  • Dbfs: het DataBricks File System
  • Beheren van je Data Lake vanuit Databricks
  • Data transformeren in een Data Lakehouse met behulp van PySpark
  • Databricks tables: managed en unmanaged
  • Hive Metastore
  • Versiebeheer in Databricks
  • Time travel
  • Schema enforcement
  • Schema evolution

Trainingsdata en inschrijven

Hieronder is een overzicht te vinden van trainingsmogelijkheden, met zowel klassikale als virtuele trainingen. Selecteer de best passende optie en start jouw reis naar succes.

  • Startdatum
    Locatie
    Duur
    Prijs
    Inschrijven

Momenteel zijn er geen trainingen gepland. Voor toekomstige mogelijkheden of maatwerkoplossingen, neem gerust contact met ons op. We helpen je graag verder!

  • 9,2 138 recensies

 

  • Persoonlijke aanpak
  • Ervaren trainers
  • 25 jaar ervaring

Wij staan voor je klaar

Al 25 jaar dé opleider op het gebied van IT in Nederland

Bij Startel streven we ernaar om elke leerervaring zo toegankelijk en persoonlijk mogelijk te maken. Of je nu geïnteresseerd bent in het volgen van een training, het bestellen van een zelfstudiepakket of een vraag hebt, ons team staat klaar om jou te ondersteunen. Wij helpen jou graag bij het vinden van de geschikte training of het passende zelfstudiepakket.

 

Neem gerust contact met ons op via ons telefoonnummer of e-mailadres en geef zelf de nodige richting aan jouw carrière in de IT!

050-5028888

Niet wat je zoekt?

Laat ons je helpen!

Kies jouw richting en plan stap voor stap jouw opleidingstraject

Neem contact met ons op!