Na het volgen van de DP-3012 zelfstudie kan je:
- Bedrijfsproblemen identificeren die opgelost kunnen worden door Azure Synapse Analytics en de kernmogelijkheden en gebruikssituaties van Azure Synapse Analytics beschrijven, evenals het bepalen van de toepasbaarheid.
- Mogelijkheden en gebruikssituaties voor serverless SQL-pools identificeren, zoals het opvragen van CSV-, JSON- en Parquet-bestanden, evenals het creëren van externe databaseobjecten binnen een serverless SQL-pool.
- Kernfuncties en mogelijkheden van Apache Spark en Delta Lake beschrijven, een Spark-pool configureren, code uitvoeren binnen een Spark-notebook, Delta Lake-tabellen aanmaken en gebruiken, evenals het beheren en bevragen van gegevensstromen vanuit zowel Synapse Analytics Spark-pools als SQL-pools.
Algemene omschrijving
In dit zelfstudiepakket zit het officiële cursusmateriaal, een labomgeving en een achievement code (badge). Je hebt 180 dagen toegang tot de labomgeving.
Stap in de wereld van geavanceerde data engineering met het zelfstudiepakket Microsoft: Implementing a Data Analytics Solution with Azure Synapse Analytics (DP-3012), zorgvuldig ontworpen om jou een diepgaande inleiding te geven op de krachtige mogelijkheden van SQL dedicated- en serverless Spark-pools binnen Microsoft Azure's Synapse Analytics.
Dit zelfstudiepakket is speciaal ontwikkeld voor dataprofessionals die hun vaardigheden uit willen breiden en een diepgaand inzicht willen krijgen in data wrangling en het Extract, Load, Transform (ELT)-proces door gebruik te maken van Synapse Pipelines.
Of je nu nieuw bent in de wereld van data engineering of al ervaring hebt met Azure Data Factory (ADF) voor data-integratie, dit zelfstudiepakket biedt waardevolle inzichten en technieken om jouw data naar een hoger niveau te tillen. Leer hoe jij op een efficiënte manier data kunt verplaatsen naar de Synapse dedicated pool-database en optimaal gebruik kunt maken van de unieke voordelen van zowel dedicated als serverless Spark-pools voor schaalbare en een goedkopere data-analyse.
Doelgroep
Ben je een dataprofessional, ICT-professional of data-analist en ben je op zoek naar manieren om jouw data-analysevaardigheden naar een hoger niveau te tillen? Het zelfstudiepakket Microsoft: Implementing a Data Analytics Solution with Azure Synapse Analytics (DP-3012) is speciaal ontwikkeld voor vooruitstrevende professionals die het vermogen van data willen benutten om krachtige inzichten en resultaten te leveren binnen hun organisaties.
Dit zelfstudiepakket is met name geschikt voor de volgende mensen:
- Data engineers
- Leer hoe jij robuuste data pipelines kunt creëren en beheren binnen Azure Synapse waarmee jij data op een efficiënte manier kunt verzamelen, transformeren en analyseren.
- Data-analisten
- Verkrijg de vaardigheden om complexe datasets te verkennen en te analyseren.
- Ontdek hoe jij door middel van Azure Synapse Analytics geavanceerde data-analyseoplossingen kunt implementeren.
- BI-ontwikkelaars
- Ontdek hoe jij interactieve dashboards en rapporten kunt creëren die waardevolle zakelijke inzichten bieden, allemaal binnen het veelzijdige platform van Azure Synapse Analytics.
- ICT-projectmanagers
- Verbeter jouw vaardigheden op het gebied van projectmanagement door te leren hoe jij data-analyseprojecten kunt plannen en uit kunt voeren met Azure Synapse, wat bijdraagt aan de succesvolle levering van datagestuurde projecten.
- Cloudarchitecten
- Verdiep je in het ontwerpen van schaalbare en veilige cloudarchitecturen die gebruikmaken van Azure Synapse Analytics om de data- en analytische behoeften van jouw organisatie te ondersteunen.
Leerdoelen
Door dit zelfstudiepakket door te nemen zul je de volgende kennis en vaardigheden verkrijgen:
- Bedrijfsproblemen identificeren die Azure Synapse Analytics aankaart.
- De kernmogelijkheden van Azure Synapse Analytics beschrijven.
- Bepalen wanneer Azure Synapse Analytics te gebruiken.
- Mogelijkheden en gebruikssituaties voor serverless SQL-pools in Azure Synapse Analytics identificeren.
- CSV JSON- en Parquet-bestanden opvragen met behulp van een serverless SQL-pool.
- Externe databaseobjecten creëren in een serverless SQL-pool.
- Kernfuncties en mogelijkheden van Apache Spark identificeren.
- Een Spark-pool configureren in Azure Synapse Analytics.
- Code uitvoeren om gegevens te laden, analyseren en te visualiseren in een Spark-notebook.
- De belangrijkste kenmerken en mogelijkheden van Delta Lake beschrijven.
- Delta Lake-tabellen aanmaken en gebruiken in een Synapse Analytics Spark-pool.
- Spark-catalogustabellen aanmaken voor Delta Lake-tabellen.
- Delta Lake-tabellen gebruiken voor streaming gegevens.
- Delta Lake-tabellen bevragen vanuit een Synapse Analytics SQL-pool.
- Een schema ontwerpen voor een relational data warehouse.
- Maken van fact dimension en staging tabellen.
- SQL gebruiken om gegevens in data warehouse-tabellen te laden.
- SQL gebruiken om relational data warehouse-tabellen op te vragen.
- Kernconcepten voor Azure Synapse Analytics-pipelines beschrijven.
- Een pipeline creëren in Azure Synapse Studio.
- Een dataflow-activiteit in een pipeline implementeren.
- Pipeline-runs in gang zetten en monitoren.
Voorkennis
Om het meeste uit dit geavanceerde zelfstudiepakket te halen, is een goede basiskennis nodig in verschillende cruciale technieken en oplossingen. Wij raden jou aan om vertrouwd te raken met een aantal notebooks en programmeertalen, evenals met de kernbeginselen van cloud computing en data, zodat jij volledig voorbereid bent op de rijke leerervaring die het zelfstudiepakket Microsoft: Implementing a Data Analytics Solution with Azure Synapse Analytics (DP-3012) biedt.
Voordat je dit zelfstudiepakket doorneemt raden wij aan dat jij over de volgende kennis en vaardigheden beschikt:
- Ervaring met meertalige notebooks en Apache Spark
- Zorg dat je vertrouwd bent met het gebruik van notebooks die meerdere programmeertalen ondersteunen, zoals Databricks, Jupyter Notebooks, en Zeppelin-notebooks. Deze hulpmiddelen zijn cruciaal voor het verwerken en analyseren van grote datasets met behulp van Spark-engines.
- Praktische Kennis van SQL, Python, en Microsoft Azure-hulpmiddelen
- Een goede beheersing van SQL en Python is onmisbaar voor data-analyse en -manipulatie. Daarnaast is ervaring met Microsoft Azure-hulpmiddelen zoals Data Factory belangrijk voor het efficiënt beheren van data workflows in de cloud.
- Begrip van cloud computing en Microsoft Azure
- Een algemeen begrip van cloudoplossingen, met name binnen het Microsoft Azure-platform, stelt jou in staat om cloudgebaseerde data-analyseoplossingen effectief te besturen en te implementeren.
- Inzicht in fundamentele dataonderwerpen
- Kennis van de basisprincipes van data, zoals datastructuren, datamanipulatie, en dataopslag, legt het fundament voor het succesvol doornemen van dit zelfstudiepakket.
Onderwerpen
Module 1: Introduction to Azure Synapse Analytics
- Identify the business problems that Azure Synapse Analytics addresses.
- Describe core capabilities of Azure Synapse Analytics.
- Determine when to use Azure Synapse Analytics.
Lab: Explore Azure Synapse Analytics
Module 2: Use Azure Synapse serverless SQL pool to query files in a data lake
- Identify capabilities and use cases for serverless SQL pools in Azure Synapse Analytics.
- Query CSV JSON and Parquet files using a serverless SQL pool.
- Create external database objects in a serverless SQL pool.
Lab: Query files using a serverless SQL pool
Module 3: Analyze data with Apache Spark in Azure Synapse Analytics
- Identify core features and capabilities of Apache Spark.
- Configure a Spark pool in Azure Synapse Analytics.
- Run code to load analyze and visualize data in a Spark notebook.
Lab: Analyze data with Spark
Module 4: Use Delta Lake in Azure Synapse Analytics
- Describe core features and capabilities of Delta Lake.
- Create and use Delta Lake tables in a Synapse Analytics Spark pool.
- Create Spark catalog tables for Delta Lake data.
- Use Delta Lake tables for streaming data.
- Query Delta Lake tables from a Synapse Analytics SQL pool.
Lab: Use Delta Lake in Azure Synapse Analytics
Module 5: Analyze data in a relational data warehouse
- Design a schema for a relational data warehouse.
- Create fact dimension and staging tables.
- Use SQL to load data into data warehouse tables.
- Use SQL to query relational data warehouse tables.
Lab: Explore a data warehouse
Module 6: Build a data pipeline in Azure Synapse Analytics
- Describe core concepts for Azure Synapse Analytics pipelines.
- Create a pipeline in Azure Synapse Studio.
- Implement a data flow activity in a pipeline.
- Initiate and monitor pipeline runs.
Lab: Build a data pipeline in Azure Synapse Analytics