Mediathek

Medium

Thema

Artikel

Möchtest du bei SQL-Abfragen keine Zeit verlieren und blitzschnelle Resultate für deine Daten aus Data Warehouses, Data Lakes oder Data Mesh?

Starburst ist die schnellste SQL-Abfrage-Engine und basiert auf der Open Source-Software Trino. Damit verarbeitest und analysierst du deine Daten in Rekordzeit. Verschwende keine Zeit mehr mit langsamen SQL-Engines.

Seine wahre Stärke spielt Starburst bei Big Data Analysen aus. Verarbeite blitzschnell Daten aus Datenquellen wie etwa Hadoop Distributed File System (HDFS), Azure Blob File System (ABFS), AWS Simple Storage Service (S3) und dem Google Cloud Storage.

Artikel

Ein Data Lake eignet sich hervorragend, um riesige Datenmengen (im Petabyte-Bereich) in einem beliebigen Format ohne voriges Konvertieren abzuspeichern. Gleichzeitig bleibt der Verarbeitungsdurchsatz hoch.
Im Gegensatz zu einem Data Warehouse ist ein Schema vor dem Laden der Daten beim Data Lake nicht nötig. Beim Data Warehouse erfolgt das Bilden des Schemas erst beim Lesen der Daten, was zu mehr Flexibilität beim Analysieren und einer extremen Vereinfachung des Data Ingest führt.

In unserem Artikel erfahren Sie, wie Sie einen Data Lake zukunftssicher und flexibel mit Pentaho einrichten und betreiben.