Twee mannen en twee vrouwen volgen een training bij Startel.
Klassikale / virtuele training

Transform data with pySpark dataframes

  • Intermediate
  • 2 dagen
  • Nederlands

In de training Transform data with pySpark dataframes leer je hoe jij Python op Spark clusters in kunt zetten om data op grote schaal te transformeren en klaar te stomen voor verschillende toepassingen. Met behulp van Databricks en Microsoft Synapse Spark pools zul je ontdekken hoe jij Spark Dataframes aan kunt maken, hoe jij data aan kunt passen en hoe jij data op kunt slaan op de gewenste locatie voor rapportages en dashboards.

9.2
  • Ervaren en gecertificeerde trainers
  • Meer dan 25 jaar ervaring in opleiden

Ontwikkel jouw dataopslagvaardigheden

Deze dataopslagtraining bestaat uit praktijkgerichte opdrachten, duidelijke theorie en professionele begeleiding. Zo zul je in staat zijn om de opgedane kennis en vaardigheden in praktijk te brengen.

Over de Transform data - pySpark dataframes

In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.

Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aansluit op jouw analyses.

Na de transformatie van jouw data zul je in de training Transform data with pySpark dataframes zien hoe jij deze weg kunt schrijven naar de gewenste locatie. Of het nu voor rapportages, dashboards of andere toepassingen bedoeld is, jij hebt de vrijheid om data precies op te slaan daar waar het nodig is.

Voor wie is deze pySpark dataframes training?

De training Transform data with pySpark dataframes is geschikt voor iedereen die Spark wil gebruiken om datamanipulaties uit te voeren.

Dit betreft met name de volgende mensen:

  • Microsoft Fabric-gebruikers.
  • Data-analisten.
  • Data engineers.
  • Data scientists (datawetenschappers).
  • Mensen met vergelijkbare functies binnen het vakgebied van datawetenschap en -analyse.

Leerdoelen van deze pySpark training

Door de training Transform data with pySpark dataframes te volgen, zul je de volgende kennis en vaardigheden verkrijgen:

  • Dataframes aanmaken op basis van verschillende bronnen.
  • Data koppelen, filteren, aggregeren en op andere wijze transformeren.
  • Werken met delta-tabellen.
  • Data binnen Data Lakes partitioneren.

Aanbevolen voorkennis pySpark dataframes

Voordat je deelneemt aan de training Transform data with pySpark dataframes, raden wij aan dat jij beschikt over enige kennis van de programmeertalen Python en SQL, echter is dit niet verplicht.

Onderwerpen van deze pySpark training

In de training Transform data with pySpark dataframes, zullen de volgende onderwerpen aan bod komen:

  • Inleiding op Spark.
  • Data lezen.
    • Dataframes creëren.
    • CSV, JSON, SQL table.
    • Schema.
  • Data transformeren.
    • Kolommen selecteren.
      • Berekende kolommen toevoegen.
  • Rijen filteren.
  • Join.
  • Groeperen.
    • Ranking en windowing.
  • SQL gebruiken.
  • Naar bestanden en tabellen schrijven.
  • Partition by.
  • Werken met delta-tabellen.
  • Optimaliseren.

Beschikbare opties voor de pySpark dataframes training

  • Klassikaal / virtueel

    € 1125 excl. BTW

  • Incompany

    Prijs op maat

Start gegarandeerd

Trainingen met ‘start gegarandeerd’ gaan altijd door op de geplande datum.

Momenteel geen startgarantie?
Neem contact met ons op

Waarom cursisten kiezen voor een Microsoft training bij Startel

Wil je een Microsoft-certificering behalen? Dan wil je trainen bij een opleider met ervaring, kwaliteit en een bewezen staat van dienst. Al meer dan 20 jaar ondersteunen wij professionals en organisaties bij het behalen van Microsoft-certificeringen en het opbouwen van praktijkgerichte kennis. Hieronder vind je een aantal cijfers die laten zien waarom cursisten voor Startel kiezen als Microsoft-opleider.

  • 20+  Jaar officiële Microsoft-opleider
  • 9,3 Score op onze Microsoft trainingen
  • 20+ Jaar ervaring met Microsoft Certificeringen
  • 40+ Erkende trainers (MCT)
  • TOP5 Beste IT-opleiders van Nederland (Computable)

Kies voor groei, net als deze organisaties

Ervaringen van onze deelnemers

  • Sten Numan aan het bellen in het Yelgo kantoor.

    Door onze samenwerking met Startel kunnen we onze mensen helpen om continu te groeien.

    Door onze samenwerking met Startel kunnen we onze mensen helpen om continu te groeien.
    Sten Numan
    Lees gehele testimonial
  • Foto van klant (Alex Tabak) die aan het typen is.

    De manier waarop Startel opleidt, geeft veel vertrouwen.

    Maar er zijn ook mensen die bijscholing nodig hebben. Zoals de man die ooit systeembeheerder was bij een grote universiteit en die de afgelopen tien jaar door omstandigheden thuis heeft gezeten.
    Alex Tabak
    Lees gehele testimonial
  • Foto van klant (Edwin Schoonbeek) die een boek leest.

    Je merkt aan alles dat Startel geen statisch bedrijf is

    De droom is om Cyber Security Officer (CSO) te worden. Met deze opleidingen ontdek ik of dit beroep echt bij me past. Het fascineert me om de veiligheid in een bedrijf te waarborgen, vooral omdat we steeds meer te maken krijgen met digitale uitdagingen.
    Edwin Schoonbeek
    Lees gehele testimonial
  • Foto van klant (Jons van der Heul) die aan het werk is.

    Startel bood me de springplank naar een nieuwe carrière.

    Startel heeft veel trainingen om uit te kiezen en tussen sommige zit best wat overlap. In overleg met mij hebben ze een basispakket op maat voor me samengesteld bestaande uit drie cursussen.
    Jons van der Heul
    Lees gehele testimonial
  • Foto van klant (Gerrit Meijering) die aan zijn werkplek zit.

    Startel heeft altijd een passend aanbod op onze vraag.

    Startel ken ik al heel lang. Toen zij nog op hun vorige locatie in Roden zaten, en ik nog bij mijn vorige werkgever werkte, volgde ik al cursussen en trainingen bij ze.
    Gerrit Meijering
    Lees gehele testimonial
  • Startel heeft ons echt geholpen om stappen te zetten.

    Bij Meneer Kooi houden we van oplossingen die het werk écht makkelijker maken. AI past daar goed bij. In eerste instantie gebruikten we het vooral individueel. Om bijvoorbeeld sneller te schrijven, ideeën scherper te krijgen en werk te versnellen. Maar de echte winst zit natuurlijk in hoe je het als organisatie inzet.
    Steven van der Heide
    Lees gehele testimonial
Bekijk alle testimonials

Beoordeling over deze pySpark training

  • Startel heeft een beoordeling van vijf sterren gekregen.
    Hanneke Debie-ten Have
    BNG

Vervolgtrainingen na deze pySpark training

  • Volg een klassikale training bij Startel in Drachten samen met jouw collega's.
    Swipe voor meer
    Microsoft Fabric Analytics Engineer (DP-600)
    • Intermediate
    • 4 dagen
    De DP-600 training: Microsoft Fabric Analytics Engineer geeft je de vaardigheden om krachtige data-oplossingen te ontwerpen en te beheren binnen Microsoft Azure. Ideaal voor data engineers die klaar zijn om hun Azure-kennis naar het volgende niveau te brengen. Volg de Fabric training en bereid je vo
    Bekijk deze training
  • Volg een training bij Startel in Drachten. Leer samen met andere cursisten.
    Swipe voor meer
    Implementing a Lakehouse with Microsoft Fabric (DP-601)
    • Intermediate
    • 1 dag
    De Implementing a Lakehouse with Microsoft Fabric (DP-601) training richt zich op het implementeren van datawetenschappelijke oplossingen met Microsoft Azure. Tijdens deze cursus leer je hoe je datawetenschapsmodellen kunt ontwerpen, ontwikkelen en implementeren met Azure Machine Learning en andere
    Bekijk deze training
  • Volg een klassikale training bij Startel onder begeleiding van een ervaren trainer.
    Swipe voor meer
    Implement a Data Warehouse with Microsoft Fabric (DP-602)
    • Beginner
    • 1 dag
    De training Implement a Data Warehouse with Microsoft Fabric (DP-602) biedt jou als data-analist of data engineer de essentiële tools en kennis om moeiteloos een robuust datawarehouse op te zetten en te beheren met Microsoft Fabric. Ontdek de nieuwste technieken voor het implementeren en opti
    Bekijk deze training
  • Volg een klassikale training bij Startel in Drachten. Krijg persoonlijke aandacht van een ervaren trainer.
    Swipe voor meer
    Implementing Real Time Analytics with Microsoft Fabric (DP-603)
    • Beginner
    • 1 dag
    In de training Implementing Real Time Analytics with Microsoft Fabric (DP-603) krijg jij een diepgaande en uitgebreide inleiding op de mogelijkheden van Real-Time Analytics binnen Microsoft Fabric. Deze training is ontworpen voor data-analisten en databasebeheerders die verantwoordelijk zijn voor he
    Bekijk deze training
  • Leer gezamenlijk bij Startel in Drachten door klassikale trainingen te volgen.
    Swipe voor meer
    Implement a Data Science and Machine Learning Solution for AI with Microsoft Fabric (DP-604)
    • Beginner
    • 1 dag
    De training Implement a Data Science and Machine Learning Solution for AI with Microsoft Fabric (DP-604) biedt een uitgebreide en diepgaande kennismaking met de mogelijkheden van datawetenschap en machine learning binnen Microsoft Fabric.
    Bekijk deze training
  • Volg een klassikale training bij Startel met persoonlijke aandacht en interactie.
    Swipe voor meer
    Develop dynamic reports with Microsoft Power BI (DP-605)
    • Beginner
    • 1 dag
    In de training Develop Dynamic Reports with Microsoft Power BI (DP-605) leer je hoe jij dynamische rapporten kunt maken door middel van Microsoft Power BI. Deze training is speciaal ontworpen voor data-analisten die verantwoordelijk zijn voor het maken en beheren van gegevensrapporten.
    Bekijk deze training
Bekijk alle trainingen

Veelgestelde vragen over de training Transform data with pySpark dataframes

  • Wat leer ik in de training Transform data with pySpark dataframes?

    In de training Transform data with pySpark dataframes leer je hoe jij gegevens kunt transformeren en verwerken met pySpark DataFrames. Daarbij zul je praktische inzichten opdoen in filtering, aggregaties, joins, transformaties en het analyseren van datasets binnen een schaalbare dataomgeving.

  • Wat zijn de belangrijkste voordelen van het gebruik van pySpark dataframes voor data-analyse?

    In de training Transform data with pySpark dataframes zul je de voordelen van pySpark ervaren voor het verwerken van grote datasets. PySpark dataframes bieden schaalbaarheid, ondersteuning voor gedistribueerde verwerking en compatibiliteit met verschillende dataformaten.

  • Voor wie is de training Transform data with pySpark dataframes bedoeld?

    De training Transform data with pySpark dataframes is geschikt voor ICT-professionals die met data-analyse en gegevensverwerking werken. Hierbij kun je denken aan data engineers, data-analisten, datawetenschappers (data scientists), softwareontwikkelaars en andere ICT-professionals die gegevens willen verwerken met pySpark.

  • Welke sectoren kunnen profiteren van vaardigheden in pySpark?

    Binnen sectoren als financiën, gezondheidszorg, e-commerce en ICT wordt er gebruikgemaakt van pySpark voor grootschalige data-analyse. Mensen die binnen deze sectoren werken, zullen baat hebben bij het volgen van de training Transform data with pySpark dataframes.

  • In welke taal wordt de training Transform data with pySpark dataframes gegeven?

    De training Transform data with pySpark dataframes wordt verzorgd door een Nederlandstalige trainer. De technische begrippen, codevoorbeelden en eventuele documentatie zijn daarentegen Engelstalig.

  • Kan ik met de Transform data with pySpark dataframes training een certificering behalen?

    De training Transform data with pySpark dataframes leidt niet tot een specifieke certificering. Na afloop zul je echter een certificaat van deelname ontvangen en in staat zijn om de opgedane pySpark-kennis in praktijk te brengen.

  • Hoe kan de training Transform data with pySpark dataframes mijn carrière in data-analyse bevorderen?

    Door de training Transform data with pySpark dataframes te volgen, zul je de theoretische kennis en praktische inzichten opdoen om functies te bekleden in data engineering, big data-analyse en machine learning (ML).

  • Moet ik mijn eigen laptop meebrengen voor de training Transform data with pySpark dataframes?

    Om te oefenen met de praktische oefeningen in de training Transform data with pySpark dataframes, is het van belang dat jij jouw eigen laptop meebrengt.

Terugbelverzoek

Wil je meer weten, maar nu even geen tijd?

Laat je gegevens achter, dan nemen wij binnen 2 werkdagen contact met je op

Dé IT-opleider van het noorden

  • Klanten geven ons een 9.2
  • Erkende trainers
  • Ontvang een certificaat na deelname
  • Train op één van onze drie locaties of vanuit huis

Terugbelverzoek

Vul hieronder jouw gegevens in, zodat wij telefonisch contact met je kunnen opnemen.

"*" geeft vereiste velden aan

Laat ons jou terugbellen
Velden met een * zijn verplicht

Vragen of direct contact nodig, bezoek onze contactpagina.

Kleine foto van Pieter Fokkema op een beige achtergrond.

Pieter Fokkema

Directeur

Offerte

Vraag hier je offerte aan

Je kan eenvoudig een offerte aanvragen voor maatwerk, incompany of losse trainingen. Vul het formulier in en wij nemen snel contact met je op om je wensen door te nemen.

Dé IT-opleider van het noorden

  • Klanten geven ons een 9.2
  • Erkende trainers
  • Ontvang een certificaat na deelname
  • Train op één van onze drie locaties of vanuit huis

Offerte (incompany)

Vul hier al je gegevens in waarvoor je een offerte wilt ontvangen.

"*" geeft vereiste velden aan

Vragen of direct contact nodig, bezoek onze contactpagina.

Eliano Patty.

Eliano Patty

Hoofd sales

Brochure

Download de brochure

Laat je gegevens achter, dan nemen wij z.s.m. contact met je op

Dé IT-opleider van het noorden

  • Klanten geven ons een 9.2
  • Erkende trainers
  • Ontvang een certificaat na deelname
  • Train op één van onze drie locaties of vanuit huis

Download Brochure

"*" geeft vereiste velden aan

Brochure downloaden
Vul hier al je gegevens in om de brochure te downloaden.

Vragen of direct contact nodig, bezoek onze contactpagina.

Eliano Patty.

Eliano Patty

Hoofd sales