EN | DE

Data Preparation im Kontext von Data Science Projekten

Dieses Event ist leider schon vorbei.
Melden Sie sich hier zum nächsten an!

Zirka 80% seiner Zeit beschäftigt sich ein Data Scientist mit dem Thema Data Preparation. Warum ist das so und kann man den Aufwand nicht reduzieren?

Daten sind die Grundlage für jedes Data Science- oder Machine Learning-Projekt. Es ist daher nicht verwunderlich, dass sich ein Data Scientist sehr intensiv mit den zugrundeliegenden Daten auseinander setzt. Die Qualität der Rohdaten muss zunächst in einer explorativen Phase bestimmt und anschließend können Transformationsmaßnahmen unternommen werden, um eine hohe Datenqualität zu gewährleisten.

Anhand dieser Datenbasis muss dann eine Selektion der relevanten Features vorgenommen werden, welche sich direkt auf die Performance des späteren Modelles auswirkt.

In diesem Webinar wollen wir zeigen, was typische Probleme im Bereich Data Preparation sind und wie man mit diesen Herausforderungen umgehen kann.

Dabei schauen wir uns auch an, wie es nach der Data Preparation Phase weiter geht, um ein passendes Modell zu identifizieren und zu validieren. Für das Deployment des fertigen Modells haben wir einige Praxistipps für Sie parat.

Agenda

  1. Einleitung TDWI
  2. Daten und ihre Aufbereitung
    • Warum Data Preparation wichtig ist
    • Darstellung Standardablauf Data Preparation
    • Konkrete Lösungsansätze für typische Data Preparation Probleme
  3. Data Science
    • Modellierung
    • Evaluierung des Modells
    • Deployment des Modells
YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Pentaho User Meeting 2021: Usecases, Praxisbeispiele und Live-Demos zu Pentaho