Pentaho ist einer der weltweit führenden Anbieter für Business Intelligence-Software im Bereich Open Source. Pentahos Plattform fasst verschiedene bewährte Einzellösungen zu einem kompletten BI-Framework zusammen – Nutzer erhalten die Software und den Support durch Pentaho aus einer Hand.
Modulare BI-Suite für individuelle Kundenlösungen
Pentaho besitzt eine offene Architektur, die sich mit einer großen Anzahl von Schnittstellen einfach in bestehende IT-Landschaften eingliedern lässt. Anders als traditionelle BI-Lösungen besteht die Pentaho Suite aus verschiedenen Einzelmodulen. Dazu zählt u.a. der Pentaho Server, der das BI-Framework umfasst, das wiederum das ETL, die Webdienste und das Sicherheitszentrum enthält. Hinzu kommen Komponenten für die Report-Erstellung, Analyse, Workflow, Dashboards und Data Mining sowie die BI-Workbench, einer Reihe von Design- und Verwaltungstools.
Pentaho unterstützt alle wichtigen Big Data-Quellen
Pentahos Plattform unterstützt viele Big Data-spezifische Verarbeitungsschritte, beispielsweise das Ausführen von MapReduce-Jobs und Pig- oder Hive-Scripte. So kann etwa das Tool Pentaho Data Integration (PDI) sowohl für die Entwicklung als auch für die Visualisierung verwendet werden und ermöglicht beispielsweise Datenentwicklern und Analysten, gemeinsam an der Erstellung neuer Datensätze zu arbeiten. Für die wichtigsten Big Data-Quellen bietet Pentaho umfassende Unterstützung: Neben Hadoop unterstützt Pentaho auch NoSQL-Datenbanken wie Cassandra/Data-Stax, HBase, MongoDB, und HPCC Systems sowie analytische Datenbanken wie Infobright oder Vectorwise.
Vorteile von Pentaho:
- Unterstützung bei der Einführung von Big Data-Technologien, sodass keine spezialisierten Kenntnisse von Seiten des Unternehmens notwendig sind
- Kombination von Einzellösungen zu einem integrierten Framework
- Flexible Zusammenstellung der Software-Komponenten ermöglicht individuelle Lösungen nach Kundenbedarf
- Einheitlich gestaltetes User Interface der BI-Plattform über alle Funktionen sorgt für komfortable und intuitive Bedienbarkeit
Flexible Erweiterung um proprietäre Funktionen
Neben den Open Source Software-Komponenten, die in der sogenannten Pentaho Community Edition enthalten sind, bietet Pentaho auch proprietäre Funktionen. Diese können entweder einzeln oder zusammengefasst als komplette Suite, der Pentaho Enterprise Edition, bezogen werden. Alle Komponenten der Community Edition stehen unter Open Source-Lizenzen und sind in Java entwickelt. Die Enterprise Edition bietet zusätzliche Software-Komponenten und Dienstleistungen an, wie zum Beispiel einen Kundensupport. Damit stellt Pentaho eine flexible und kostengünstige Software-Suite für die Anbindung von Big Data-Technologien und bietet eine leistungsfähige und moderne Anwendung für die Auswertung von sehr großen Datenbeständen.
Diese Artikel unser Serie “Die 10 wichtigsten Big Data-Technologien” könnten Sie auch interessieren:
- 10 Big Data-Technologien, die Sie kennen sollten
- Apache Hadoop – ein bewährtes Open Source-Framework
- Apache Hive – das Data Warehouse für Hadoop
- Cloudera Impala – die Lösung für Echtzeitabfragen
- MongoDB – Die Datenbank für alle Fälle
- Infobright – MySQL-Engine mit effektiver Datenkompression
- Apache Spark – Framework für Echtzeitanalysen
- Splunk – Big Data vereinfachen
- Hadoop Yarn – Big Data beschleunigen
- Apache Storm – Big Data-Analyse auf Echtzeitbasis