Transform data with pySpark dataframes

In de training Transform data with pySpark dataframes leer je hoe jij Python op Spark clusters in kunt zetten om data op grote schaal te transformeren en klaar te stomen voor verschillende toepassingen. Met behulp van Databricks en Microsoft Synapse Spark pools zul je ontdekken hoe jij Spark Dataframes aan kunt maken, hoe jij data aan kunt passen en hoe jij data op kunt slaan op de gewenste locatie voor rapportages en dashboards.

  • Offerte aanvragen

    "*" geeft vereiste velden aan

    Offerte aanvraag training
    Vul hier al je gegevens in waarvoor je een offerte wilt ontvangen.
    Vul hier jouw naam in*
    Vermeld eventuele specifieke wensen en het aantal deelnemers.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Foto van medewerker van Startel (Eliano Patty).
    x
  • Incompany

    "*" geeft vereiste velden aan

    Vul hier jouw naam in*
    Vermeld eventuele specifieke wensen en het aantal deelnemers.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Foto van medewerker van Startel (Eliano Patty).
    x
  • Download brochure

    "*" geeft vereiste velden aan

    Brochure downloaden
    Vul hier al je gegevens in om de brochure te downloaden.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Foto van medewerker van Startel (Eliano Patty).
    x

Breid je expertise uit!

  • Trainen bij onze locatie in Drachten
  • Krijg een certificaat van deelname
  • Leer van ervaren trainers

€1095,- Excl. BTW

Algemene omschrijving

In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.

Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aansluit op jouw analyses.

Na de transformatie van jouw data zul je in de training Transform data with pySpark dataframes zien hoe jij deze weg kunt schrijven naar de gewenste locatie. Of het nu voor rapportages, dashboards of andere toepassingen bedoeld is, jij hebt de vrijheid om data precies op te slaan daar waar het nodig is.

Doelgroep

De training Transform data with pySpark dataframes is geschikt voor iedereen die Spark wil gebruiken om datamanipulaties uit te voeren.

Dit betreft met name de volgende mensen:

  • Microsoft Fabric-gebruikers.
  • Data-analisten.
  • Data engineers.
  • Data scientists (datawetenschappers).
  • Mensen met vergelijkbare functies binnen het vakgebied van datawetenschap en -analyse.

Leerdoelen

Door de training Transform data with pySpark dataframes te volgen, zul je de volgende kennis en vaardigheden verkrijgen:

  • Dataframes aanmaken op basis van verschillende bronnen.
  • Data koppelen, filteren, aggregeren en op andere wijze transformeren.
  • Werken met delta-tabellen.
  • Data binnen Data Lakes partitioneren.

Voorkennis

Voordat je deelneemt aan de training Transform data with pySpark dataframes, raden wij aan dat jij beschikt over enige kennis van de programmeertalen Python en SQL, echter is dit niet verplicht.

Onderwerpen

In de training Transform data with pySpark dataframes, zullen de volgende onderwerpen aan bod komen:

  • Inleiding op Spark.
  • Data lezen.
    • Dataframes creëren.
    • Csv, json, SQL table.
    • Schema.
  • Data transformeren.
    • Kolommen selecteren.
      • Berekende kolommen toevoegen.
  • Rijen filteren.
  • Join.
  • Groeperen.
    • Ranking en windowing.
  • SQL gebruiken.
  • Naar bestanden en tabellen schrijven.
  • Partition by.
  • Werken met delta-tabellen.
  • Optimaliseren.

Trainingsdata en inschrijven

Hieronder is een overzicht te vinden van trainingsmogelijkheden voor de Transform data with pySpark dataframes training, met zowel klassikale als virtuele trainingen. Selecteer de best passende optie en start jouw reis naar succes.

  • Klassikaal
  • Virtueel
  • Startdatum
    Locatie
    Duur
    Prijs
    Inschrijven
    • 21-01-2025
      Startel (Drachten)
      2 bijeenkomsten
      • dinsdag 21 januari 2025 van 09:00 tot 17:00
      • woensdag 22 januari 2025 van 09:00 tot 17:00
      1095,-
    • 20-02-2025
      Startel (Drachten)
      2 bijeenkomsten
      • donderdag 20 februari 2025 van 09:00 tot 17:00
      • vrijdag 21 februari 2025 van 09:00 tot 17:00
      1095,-
    • 24-03-2025
      Startel (Drachten)
      2 bijeenkomsten
      • maandag 24 maart 2025 van 09:00 tot 17:00
      • dinsdag 25 maart 2025 van 09:00 tot 17:00
      1095,-
    • 24-04-2025
      Startel (Drachten)
      2 bijeenkomsten
      • donderdag 24 april 2025 van 09:00 tot 17:00
      • vrijdag 25 april 2025 van 09:00 tot 17:00
      1095,-
    • 26-05-2025
      Startel (Drachten)
      2 bijeenkomsten
      • maandag 26 mei 2025 van 09:00 tot 17:00
      • dinsdag 27 mei 2025 van 09:00 tot 17:00
      1095,-
    • 24-06-2025
      Startel (Drachten)
      2 bijeenkomsten
      • dinsdag 24 juni 2025 van 09:00 tot 17:00
      • woensdag 25 juni 2025 van 09:00 tot 17:00
      1095,-
    • 21-01-2025
      Virtual
      2 bijeenkomsten
      • dinsdag 21 januari 2025 van 09:00 tot 17:00
      • woensdag 22 januari 2025 van 09:00 tot 17:00
      1095,-
    • 20-02-2025
      Virtual
      2 bijeenkomsten
      • donderdag 20 februari 2025 van 09:00 tot 17:00
      • vrijdag 21 februari 2025 van 09:00 tot 17:00
      1095,-
    • 24-03-2025
      Virtual
      2 bijeenkomsten
      • maandag 24 maart 2025 van 09:00 tot 17:00
      • dinsdag 25 maart 2025 van 09:00 tot 17:00
      1095,-
    • 24-04-2025
      Virtual
      2 bijeenkomsten
      • donderdag 24 april 2025 van 09:00 tot 17:00
      • vrijdag 25 april 2025 van 09:00 tot 17:00
      1095,-
    • 26-05-2025
      Virtual
      2 bijeenkomsten
      • maandag 26 mei 2025 van 09:00 tot 17:00
      • dinsdag 27 mei 2025 van 09:00 tot 17:00
      1095,-
    • 24-06-2025
      Virtual
      2 bijeenkomsten
      • dinsdag 24 juni 2025 van 09:00 tot 17:00
      • woensdag 25 juni 2025 van 09:00 tot 17:00
      1095,-

Veelgestelde vragen over de training Transform data with pySpark dataframes

  • Wat zijn de belangrijkste voordelen van het gebruik van pySpark dataframes voor data-analyse?

    In de training Transform data with pySpark dataframes zul je de voordelen van pySpark ervaren voor het verwerken van grote datasets. PySpark dataframes bieden schaalbaarheid, ondersteuning voor gedistribueerde verwerking en compatibiliteit met verschillende dataformaten.

  • Is de training Transform data with pySpark dataframes geschikt voor beginners in big data?

    De training Transform data with pySpark dataframes is geschikt voor beginners, echter is basiskennis van Python en data-analyse sterk aanbevolen om de training Transform data with pySpark dataframes zo goed mogelijk te kunnen volgen.

  • Hoe kan de training Transform data with pySpark dataframes mijn carrière in data-analyse bevorderen?

    Door de training Transform data with pySpark dataframes te volgen, zul je de kennis en vaardigheden verkrijgen om functies te bekleden in data engineering, big data-analyse en machine learning.

  • Welke sectoren kunnen profiteren van vaardigheden in pySpark?

    In sectoren als financiën, gezondheidszorg, e-commerce en ICT wordt er gebruikgemaakt van pySpark voor grootschalige data-analyse. Mensen die binnen deze sectoren werken, zullen baat hebben bij het volgen van de training Transform data with pySpark dataframes.

Hulp nodig?
Wij helpen je!

Neem contact met ons op

of laat Eliano je terugbellen
Terugbelverzoek
Vul hieronder jouw gegevens in, zodat wij telefonisch contact met je kunnen opnemen.
Vul hieronder aanvullende informatie in over jouw vraag, zodat wij jou zo goed mogelijk kunnen helpen.
Wij zijn dé IT-opleider van het noorden
  • Train bij ons in Drachten of op jouw eigenlocatie.
  • Klanten geven ons een 9.2
  • Erkende trainers.
  • Ontvang een certificaat na deelname!
Foto van medewerker van Startel (Eliano Patty).
x
Foto van medewerker van Startel (Eliano Patty).
  • 9,2 146 recensies

 

  • Persoonlijke aanpak
  • Ervaren trainers
  • 25 jaar ervaring