Pentaho Data Integration Advanced
Pentaho Kurs-ID
Dauer:
Termine:
Auf Anfrage
Kursbeschreibung
Dieser von einem Trainer geleitete Kurs baut auf den grundlegenden Kenntnissen von Pentaho Data Integration (PDI) auf. Über die Grundlagen der Erstellung von Transformationen und Jobs hinaus lernen Sie, wie Sie PDI in realen Projektszenarien einsetzen können. Sie fügen PDI als Datenquelle für eine Vielzahl von Visualisierungsoptionen hinzu, nutzen die Möglichkeiten der Streaming-Datenverarbeitung von PDI, erstellen Transformationen mit Metadateninjektion und skalieren und optimieren die PDI-Lösung.
Die Teilnehmer profitieren vom Engagement und Lernen eines erfahrenen Dozenten, gepaart mit praktischen Übungen mit einer vollständigen Implementierung von Pentaho in einer virtuellen Laborumgebung.
Zielgruppe
Abschluss des Kurses „Pentaho Data Integration Fundamentals“ (PDI1000S zum Selbststudium oder PDI1000L mit Kursleiter) sowie erste Erfahrungen im Umgang mit PDI.
Business User |
Business Analyst |
Data Analyst |
Software Architect |
Pentaho Admin |
Pentaho Support |
---|---|---|---|---|---|
Lernziele
- Reduzieren von manuellen Aufgaben durch die Nutzung der Leistungsfähigkeit der Metadateninjektion.
- Verwenden von PDI als Datenquelle für CDA, Data Services, SnowFlake, Google BigQuery und Machine Learning-Anwendungen.
- Nutzen von PDIs Streaming-Datenverarbeitungsfunktionen mit MQTT, Kafka und Amazon Kinesis Data Streams.
- Skalieren von PDI mithilfe von Carte Clustering, Überwachung und Partitionierung.
- Tuning von PDI mit Checkpoints und Logging.
Kursablauf
Tag 1 |
---|
Modul 1 | Metadata Injection | |
---|---|---|
Lektion | Static Metadata Injection | |
Lektion | Standard Metadata Injection | |
Lektion | Metadata Injection (Push-Pull Modes) | |
Lektion | 2-Phase Metadata Injection | |
Lektion | Nutzung von Filtern in Metadata Injection |
Modul 2 | PDI als Enterprise Data Hub | |
---|---|---|
Lektion | CDA Datasource | |
Lektion | Data Services | |
Lektion | Connect zu einer SnowFlake Datenbank | |
Lektion | Pentaho Data Integration und Google BigQuery | |
Lektion | Usecase Kreditkartenbetrug |
Tag 2 |
---|
Modul 3 | Data Streaming | |
---|---|---|
Lektion | MQTT – Mosquitto Service | |
Lektion | MQTT – Sensor Daten(IoT) | |
Lektion | Services – Zookeeper und Kafka | |
Lektion | Kafka – Sensor Daten | |
Lektion | Amazon Kinesis Data Streams |
Modul 4 | Skalierung der Enterprise Lösung | |
---|---|---|
Lektion | Master und Slave Server | |
Lektion | Clustering und group by | |
Lektion | Stream Partitionierung | |
Lektion | Checkpoints |

Dirk Rönsch

Djordja Markovic

Laziz Karimov

Tom Haupt
Software- und Technologiewissen vertiefen
- In-House
- Online
- In Fulda
Ich habe Interesse an diesem Training!