EN | DE

Es funkt: Pentaho integriert Spark

Spark wird zukünftig von Pentaho unterstützt
Spark wird zukünftig von Pentaho unterstützt

Da hat es wohl gefunkt: Pentaho hat angekündigt, das Big Data-Tool Apache Spark unterstützen zu wollen. Damit können zukünftig Spark-Jobs direkt aus Pentaho gesteuert werden. Was die Liaison für Pentaho-Anwender und den Big Data-Markt bringt, beleuchte ich in diesem Artikel.

Spark ist ein Open Source-Framework für Cluster Computing. Im Vergleich zu Hadoop MapReduce kann Spark Jobs im In-Memory-Modus 100 Mal schneller und auf Festplatte zehnmal schneller verarbeiten. Unterstützt Pentaho zukünftig Spark, heißt das für Pentaho-Anwender, dass sie

  • von einer höheren Produktivität profitieren können,
  • geringere Kosten beim Betrieb ihrer BI- und Big Data-Anwendungen haben werden und
  • es niedrigere Hürden beim Einstieg in Big Data-Projekte geben wird aufgrund der geringeren fachlichen Anforderungen an Mitarbeiter.

Bei Pentaho ist man gerade dabei, mit sogenannten Big Data Blueprints zu experimentieren, um Use Cases für den Einsatz von Spark zu entwickeln. Das soll Unternehmen dabei helfen, die richtigen Einsatzbereiche für Spark und Pentaho zu identifizieren und leichter Big Data-Projekte umzusetzen. Dazu gehören unter anderem direkt auf Spark SQL ausgeführte Abfragen und parallel durchgeführte Spark-Abfragen (Spark Parallel Execution).

Auf den Big Data-Markt bezogen unterstreicht die Integration laut Matt Aslett, Research Director für Data Platforms and Analytics beim Analysten 451 Research, dass der Open Source-Ansatz es Pentaho ermöglicht, in einem schnell wachsenden Marktsegment rasch zu reagieren, wenn innovative Technologien an Bedeutung gewinnen. Spark gehört zu den aktivsten entwickelten Projekten im Big Data-Bereich und besitzt daher strategische Bedeutung für einen Open Source-Anbieter wie Pentaho.

Pentaho Data Integration für Apache Spark ist momentan über die Pentaho Labs erhältlich.

Es war noch nie so einfach anzufangen

Lassen Sie uns über Ihr Projekt sprechen.

Wir sollten uns kennenlernen!

STANDORTE
it-novum GmbH Deutschland
Hauptsitz
Edelzeller Straße 44 36043 Fulda Deutschland

Niederlassungen
Ruhrallee 9, 44139 Dortmund Königsallee 92a, 40212 Düsseldorf
E-Mail: info@it-novum.com
Tel.: +49 661 103-434
it-novum Zweigniederlassung Österreich
Ausstellungsstraße 50 / Zugang C
1020 Wien

E-Mail: info@it-novum.at
Tel.: +43 1 205 774 1041

it-novum Schweiz GmbH
Hotelstrasse 1,
8058 Zürich

E-Mail: info@it-novum.ch
Tel.: +41 44 567 62 07

Pentaho User Meeting 2021: Usecases, Praxisbeispiele und Live-Demos zu Pentaho