Volg een training van een expert bij Startel.
Klassikale / virtuele training

Transform data with pySpark dataframes

  • Intermediate
  • 2 dagen
  • Nederlands

In de training Transform data with pySpark dataframes leer je hoe jij Python op Spark clusters in kunt zetten om data op grote schaal te transformeren en klaar te stomen voor verschillende toepassingen. Met behulp van Databricks en Microsoft Synapse Spark pools zul je ontdekken hoe jij Spark Dataframes aan kunt maken, hoe jij data aan kunt passen en hoe jij data op kunt slaan op de gewenste locatie voor rapportages en dashboards.

9.2
  • Ervaren en gecertificeerde trainers
  • Meer dan 25 jaar ervaring in opleiden

Ontwikkel jouw dataopslagvaardigheden

Deze dataopslagtraining bestaat uit praktijkgerichte opdrachten, duidelijke theorie en professionele begeleiding. Zo zul je in staat zijn om de opgedane kennis en vaardigheden in praktijk te brengen.

  • Inschrijven
  • (Incompany) offerte aanvragen

    "*" geeft vereiste velden aan

    Vul hier jouw naam in*
    Vermeld eventuele specifieke wensen en het aantal deelnemers.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Eliano Patty op de foto.
    x
  • Download brochure

    "*" geeft vereiste velden aan

    Brochure downloaden
    Vul hier al je gegevens in om de brochure te downloaden.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Eliano Patty op de foto.
    x

Algemene omschrijving

In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.

Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aansluit op jouw analyses.

Na de transformatie van jouw data zul je in de training Transform data with pySpark dataframes zien hoe jij deze weg kunt schrijven naar de gewenste locatie. Of het nu voor rapportages, dashboards of andere toepassingen bedoeld is, jij hebt de vrijheid om data precies op te slaan daar waar het nodig is.

Doelgroep

De training Transform data with pySpark dataframes is geschikt voor iedereen die Spark wil gebruiken om datamanipulaties uit te voeren.

Dit betreft met name de volgende mensen:

  • Microsoft Fabric-gebruikers.
  • Data-analisten.
  • Data engineers.
  • Data scientists (datawetenschappers).
  • Mensen met vergelijkbare functies binnen het vakgebied van datawetenschap en -analyse.

Leerdoelen

Door de training Transform data with pySpark dataframes te volgen, zul je de volgende kennis en vaardigheden verkrijgen:

  • Dataframes aanmaken op basis van verschillende bronnen.
  • Data koppelen, filteren, aggregeren en op andere wijze transformeren.
  • Werken met delta-tabellen.
  • Data binnen Data Lakes partitioneren.

Voorkennis

Voordat je deelneemt aan de training Transform data with pySpark dataframes, raden wij aan dat jij beschikt over enige kennis van de programmeertalen Python en SQL, echter is dit niet verplicht.

Onderwerpen

In de training Transform data with pySpark dataframes, zullen de volgende onderwerpen aan bod komen:

  • Inleiding op Spark.
  • Data lezen.
    • Dataframes creëren.
    • Csv, json, SQL table.
    • Schema.
  • Data transformeren.
    • Kolommen selecteren.
      • Berekende kolommen toevoegen.
  • Rijen filteren.
  • Join.
  • Groeperen.
    • Ranking en windowing.
  • SQL gebruiken.
  • Naar bestanden en tabellen schrijven.
  • Partition by.
  • Werken met delta-tabellen.
  • Optimaliseren.

Beschikbare opties voor de pySpark dataframes training

  • Klassikaal / virtueel

    € 1095 excl. BTW

  • Incompany

    Prijs op maat

Start gegarandeerd

Trainingen met ‘start gegarandeerd’ gaan altijd door op de geplande datum.

Momenteel geen startgarantie?
Neem contact met ons op

  • Inschrijven
  • Offerte aanvragen

    "*" geeft vereiste velden aan

    Vul hier jouw naam in*
    Vermeld eventuele specifieke wensen en het aantal deelnemers.
    Wij zijn dé IT-opleider van het noorden
    • Train bij ons in Drachten of op jouw eigen locatie.
    • Klanten geven ons een 9.2
    • Erkende trainers.
    • Ontvang een certificaat na deelname!

    Kom je er niet uit?
    Laat ons je helpen!

    Contact opnemen

    Eliano Patty op de foto.
    x

Kies voor groei, net als deze organisaties

Ervaringen van onze deelnemers

  • Foto van klant (Jons van der Heul) die aan het werk is.

    Startel bood me de springplank naar een nieuwe carrière.

    Startel heeft veel trainingen om uit te kiezen en tussen sommige zit best wat overlap. In overleg met mij hebben ze een basispakket op maat voor me samengesteld bestaande uit drie cursussen.
    Jons van der Heul
    Lees gehele testimonial
  • Foto van klant (Gerrit Meijering) die aan zijn werkplek zit.

    Startel heeft altijd een passend aanbod op onze vraag.

    Startel ken ik al heel lang. Toen zij nog op hun vorige locatie in Roden zaten, en ik nog bij mijn vorige werkgever werkte, volgde ik al cursussen en trainingen bij ze.
    Gerrit Meijering
    Lees gehele testimonial
  • Foto van klant (Edwin Schoonbeek) die een boek leest.

    Je merkt aan alles dat Startel geen statisch bedrijf is

    De droom is om Cyber Security Officer (CSO) te worden. Met deze opleidingen ontdek ik of dit beroep echt bij me past. Het fascineert me om de veiligheid in een bedrijf te waarborgen, vooral omdat we steeds meer te maken krijgen met digitale uitdagingen.
    Edwin Schoonbeek
    Lees gehele testimonial
  • Sten Numan aan het bellen in het Yelgo kantoor.

    Door onze samenwerking met Startel kunnen we onze mensen helpen om continu te groeien.

    Door onze samenwerking met Startel kunnen we onze mensen helpen om continu te groeien.
    Sten Numan
    Lees gehele testimonial
  • Foto van klant (Alex Tabak) die aan het typen is.

    De manier waarop Startel opleidt, geeft veel vertrouwen.

    Maar er zijn ook mensen die bijscholing nodig hebben. Zoals de man die ooit systeembeheerder was bij een grote universiteit en die de afgelopen tien jaar door omstandigheden thuis heeft gezeten.
    Alex Tabak
    Lees gehele testimonial
Bekijk alle testimonials

Vervolgtrainingen na deze training

  • Man met bril volgt een klassikale training bij Startel.
    Swipe voor meer
    Designing and Implementing a Data Science Solution on Azure (DP-100)
    • Intermediate
    • 3 dagen
    Bekijk deze training
  • Een groep mensen volgt een IT-training bij Startel.
    Swipe voor meer
    Administering Relational Databases on Microsoft Azure (DP-300)
    • Intermediate
    • 4 dagen
    Bekijk deze training
  • Een lachende man bij Startel.
    Swipe voor meer
    Implementing a Lakehouse with Microsoft Fabric (DP-601)
    • Beginner
    • 1 dag
    Bekijk deze training
  • Een vrouw luistert naar een trainer bij Startel.
    Swipe voor meer
    Implement a Data Warehouse with Microsoft Fabric (DP-602)
    • Intermediate
    • 1 dag
    Bekijk deze training
  • Drie vrouwen volgen een training bij Startel.
    Swipe voor meer
    Implementing Real Time Analytics with Microsoft Fabric (DP-603)
    • Intermediate
    • 1 dag
    Bekijk deze training
  • Twee mannen en twee vrouwen volgen een training bij Startel.
    Swipe voor meer
    Develop dynamic reports with Microsoft Power BI (DP-605)
    • Intermediate
    • 1 dag
    Bekijk deze training
Bekijk alle trainingen

Veelgestelde vragen over de training Transform data with pySpark dataframes

  • Wat zijn de belangrijkste voordelen van het gebruik van pySpark dataframes voor data-analyse?

    In de training Transform data with pySpark dataframes zul je de voordelen van pySpark ervaren voor het verwerken van grote datasets. PySpark dataframes bieden schaalbaarheid, ondersteuning voor gedistribueerde verwerking en compatibiliteit met verschillende dataformaten.

  • Is de training Transform data with pySpark dataframes geschikt voor beginners in big data?

    De training Transform data with pySpark dataframes is geschikt voor beginners, echter is basiskennis van Python en data-analyse sterk aanbevolen om de training Transform data with pySpark dataframes zo goed mogelijk te kunnen volgen.

  • Hoe kan de training Transform data with pySpark dataframes mijn carrière in data-analyse bevorderen?

    Door de training Transform data with pySpark dataframes te volgen, zul je de kennis en vaardigheden verkrijgen om functies te bekleden in data engineering, big data-analyse en machine learning.

  • Welke sectoren kunnen profiteren van vaardigheden in pySpark?

    In sectoren als financiën, gezondheidszorg, e-commerce en ICT wordt er gebruikgemaakt van pySpark voor grootschalige data-analyse. Mensen die binnen deze sectoren werken, zullen baat hebben bij het volgen van de training Transform data with pySpark dataframes.