Implementing a Lakehouse with Microsoft Fabric (DP-601)

Deze training is ontworpen om jouw basisvaardigheden in data engineering binnen Microsoft Fabric te ontwikkelen, met de nadruk op het Lakehouse-concept.

[springest]
  • Lorem
  • Lorem
  • Lorem

Incompany training?

Liever een training op eigen locatie? Ook dan is maatwerk een vanzelfsprekende optie. We creëren aangepaste trainingen die voldoen aan de specifieke behoeften en uitdagingen van jullie organisatie. Vraag hieronder een offerte aan voor een incompany training!

Vraag offerte aan

Algemene omschrijving

Deze training is ontworpen om jouw basisvaardigheden in data engineering binnen Microsoft Fabric te ontwikkelen, met de nadruk op het Lakehouse-concept. Deze training verkent de krachtige mogelijkheden van Apache Spark voor gedistribueerde dataverwerking en de essentiële technieken voor efficiënt gegevensbeheer, versiebeheer en betrouwbaarheid door te werken met Delta Lake-tabellen.

Deze training verkent ook dataopname en -orkestratie met behulp van Dataflows Gen2 en Data Factory-pipelines. Deze training bevat een combinatie van theorie en praktijkopdrachten om jou voor te bereiden op het werken met Lakehouses in Microsoft Fabric.

Doelgroep

Deze training is voornamelijk geschikt voor dataprofessionals die bekend zijn met datamodellering, -extractie en -analyse. De training is ontworpen voor professionals die kennis willen opdoen over de architectuur van Lakehouse, het Microsoft Fabric-platform en hoe ze met deze technologieën end-to-end analytics mogelijk kunnen maken.

Leerdoelen

Door deel te nemen aan deze training zul je de volgende kennis en vaardigheden verkrijgen:

  • Het beschrijven van end-to-end analytics in Microsoft Fabric.
  • Het beschrijven van belangrijkste functies en mogelijkheden van lakehouses in Microsoft Fabric.
  • Een lakehouse creëren.
  • Data opnemen in bestanden en tabellen binnen een lakehouse.
  • Lakehouse-tabellen opvragen met SQL.
  • Spark configureren binnen een Microsoft Fabric-workspace.
  • Geschikte scenario's voor Spark-notebooks en Spark-jobs identificeren.
  • Spark-dataframes gebruiken om gegevens te analyseren en te transformeren.
  • Spark SQL gebruiken om gegevens in tabellen en views op te vragen.
  • Gegevens visualiseren binnen een Spark-notebook.
  • Het begrijpen van Delta Lake en Delta-tabellen binnen Microsoft Fabric.
  • Spark gebruiken om Delta-tabellen aan te maken en te beheren.
  • Spark gebruiken om gegevens in Delta-tabellen op te vragen en te transformeren.
  • Delta-tabellen gebruiken met Spark Structured Streaming.
  • De mogelijkheden van Dataflow (Gen2) in Microsoft Fabric beschrijven.
  • Oplossingen voor Dataflow (Gen2) creëren om data op te nemen en te transformeren.
  • Een Dataflow (Gen2) toevoegen aan een pijplijn.
  • De mogelijkheden van pijplijnen in Microsoft Fabric beschrijven.
  • De Copy Data-activiteit binnen een pijplijn gebruiken.
  • Pijplijnen creëren op basis van voorgedefinieerde sjablonen.
  • Pijplijnen uitvoeren en bewaken.

Voorkennis

Voordat jij deelneemt aan deze training raden wij aan dat jij bekend bent met de basisconcepten en -terminologie van data.

Onderwerpen

Modele 1: Introduction to end-to-end analytics using Microsoft Fabric

Discover how Microsoft Fabric can meet your enterprise's analytics needs in one platform. Learn about Microsoft Fabric, how it works, and identify how you can use it for your analytics needs.

In this module, you'll learn how to:

  • Describe end-to-end analytics in Microsoft Fabric.

Modele 2: Get started with lakehouses in Microsoft Fabric

Lakehouses merge data lake storage flexibility with data warehouse analytics. Microsoft Fabric offers a lakehouse solution for comprehensive analytics on a single SaaS platform.

In this module, you'll learn how to:

  • Describe core features and capabilities of lakehouses in Microsoft Fabric.
  • Create a lakehouse.
  • Ingest data into files and tables in a lakehouse.
  • Query lakehouse tables with SQL.

Module 3: Use Apache Spark in Microsoft Fabric

Apache Spark is a core technology for large-scale data analytics. Microsoft Fabric provides support for Spark clusters, enabling you to analyze and process data in a Lakehouse at scale.

In this module, you'll learn how to:

  • Configure Spark in a Microsoft Fabric workspace.
  • Identify suitable scenarios for Spark notebooks and Spark jobs.
  • Use Spark dataframes to analyze and transform data.
  • Use Spark SQL to query data in tables and views.
  • Visualize data in a Spark notebook.

Module 4: Work with Delta Lake tables in Microsoft Fabric

Tables in a Microsoft Fabric lakehouse are based on the Delta Lake storage format commonly used in Apache Spark. By using the enhanced capabilities of delta tables, you can create advanced analytics solutions.

In this module, you'll learn how to:

  • Understand Delta Lake and delta tables in Microsoft Fabric.
  • Create and manage delta tables using Spark.
  • Use Spark to query and transform data in delta tables.
  • Use delta tables with Spark structured streaming.

Module 5: Ingest Data with Dataflows Gen2 in Microsoft Fabric

Data ingestion is crucial in analytics. Microsoft Fabric's Data Factory offers Dataflows (Gen2) for visually creating multi-step data ingestion and transformation using Power Query Online.

In this module, you'll learn how to:

  • Describe Dataflow (Gen2) capabilities in Microsoft Fabric.
  • Create Dataflow (Gen2) solutions to ingest and transform data.
  • Include a Dataflow (Gen2) in a pipeline.

Module 6: Use Data Factory pipelines in Microsoft Fabric

Microsoft Fabric includes Data Factory capabilities, including the ability to create pipelines that orchestrate data ingestion and transformation tasks.

In this module, you'll learn how to:

  • Describe pipeline capabilities in Microsoft Fabric.
  • Use the Copy Data activity in a pipeline.
  • Create pipelines based on predefined templates.
  • Run and monitor pipelines.

Trainingsdata en inschrijven

Hieronder is een overzicht te vinden van trainingsmogelijkheden, met zowel klassikale als virtuele trainingen. Selecteer de best passende optie en start jouw reis naar succes.

  • Klassikaal
  • Virtueel
  • Startdatum
    Locatie
    Duur
    Prijs
    Inschrijven
    • 22-04-2024
      Startel (Drachten)
      1 bijeenkomst
      • maandag 22 april 2024 van 09:00 tot 17:00
      595,-
    • 24-06-2024
      Startel (Drachten)
      1 bijeenkomst
      • maandag 24 juni 2024 van 09:00 tot 17:00
      595,-
    • 22-04-2024
      Virtual
      1 bijeenkomst
      • maandag 22 april 2024 van 09:00 tot 17:00
      595,-
    • 24-06-2024
      Virtual
      1 bijeenkomst
      • maandag 24 juni 2024 van 09:00 tot 17:00
      595,-
  • 9,2 138 recensies

 

  • Persoonlijke aanpak
  • Ervaren trainers
  • 25 jaar ervaring

Wij staan voor je klaar

Al 25 jaar dé opleider op het gebied van IT in Nederland

Bij Startel streven we ernaar om elke leerervaring zo toegankelijk en persoonlijk mogelijk te maken. Of je nu geïnteresseerd bent in het volgen van een training, het bestellen van een zelfstudiepakket of een vraag hebt, ons team staat klaar om jou te ondersteunen. Wij helpen jou graag bij het vinden van de geschikte training of het passende zelfstudiepakket.

 

Neem gerust contact met ons op via ons telefoonnummer of e-mailadres en geef zelf de nodige richting aan jouw carrière in de IT!

050-5028888

Niet wat je zoekt?

Laat ons je helpen!

Kies jouw richting en plan stap voor stap jouw opleidingstraject

Neem contact met ons op!