IBM macht Apache Spark als Cloud-Service verfügbar

Ebenfalls neu sind die Insight Cloud Services, die Kontextdaten für Analytics anbieten. IBM hat auch begonnen, eigene Analytics-Projekte auf Spark umzustellen. DataWorks konnte dabei angeblich von 40 Millionen auf 5 Millionen Zeilen Quellcode reduziert werden.

IBM hat ein Angebot von Apache Spark-as-a-Service eingeführt. Der Dienst ist Teil der Bluemix-Cloud und lässt sich mit anderen Daten- und Analysediensten kombinieren, darunter Cloudant noSQL und der Data-Warehouse-Dienst dashDB.

Die Ankündigung erfolgte jetzt bei seiner Konferenz IBM Insight in Las Vegas. IBM hatte aber schon im Juni auf dem Spark Summit angekündigt, Spark zu unterstützen und 300 Millionen Dollar zu investieren. Es wollte auch ein Spark Technology Center in San Francisco gründen und 3500 Forscher für Spark abstellen.IBM (Bild: IBM)

IBM Analytics on Apache Spark wird auch Python-basierte Code-Notizbücher unterstützen – eine Funktion, die sich in Databricks Cloud-Spark-Plattform ebenfalls findet.

Parallel stellt IBM die so genannten Insight Cloud Services vor, die „externe Daten über Menschen, Veranstaltungen, Orte und Firmen aus Quellen wie Twitter und The Weather Company“ bereitstellen, wie es in der Presseerklärung heißt – also Daten, die beim Einsatz von Analytics die internen Daten des Kunden um Kontext anreichern können, um sie anschließend mit Spark auszuwerten.

ANZEIGE

MobileIron: Sichere Verwaltung von Android-Geräten

In vielen Unternehmen nutzen Mitarbeiter ihre privaten mobilen Geräte. Unternehmen, die dieser Szenario erlauben, sollten sich Gedanken über eine leistungsfähige Enterprise Mobility Management Suite machen. Nur damit lassen sich Unternehmensdaten gegen nicht autorisierten Zugriff absichern.

Der frühere Cloudant-CEO Derek Schoettle – und seit dessen Übernahme durch IBM General Manager of Cloud Data Services (CDS) – kommentierte gegenüber ZDNet.com, Spark sei nicht nur eine parallele Big-Data-Verarbeitungsplattform, sondern auch eine, die Maschinelles Lernen, Graph-Engine-Analysen und Streaming-Data-Verarbeitung einschließe. IBM sehe Spark daher als umfassende Umgebung, um mit Daten zu arbeiten.

Aus diesem Grund habe IBM rund 15 seiner eigenen Handels- und Analytics-Produkte auf Spark umgestellt. DataWorks beispielsweise habe auf diese Weise von 40 Millionen auf 5 Millionen Zeilen Quellcode reduziert werden können.

Mit DB2, Watson, Netezza, Cognos, TM1, SPSS, DataStage, Informix, Cloudant und der Hadoop-Distribution BigInsights dürfte IBM ohnehin schon das größte Angebot der Branche rund um Daten und Analytics haben – ein Portfolio, das über Jahrzehnte gewachsen ist. Diese Dienste rund um Apache Spark zu föderieren und per Cloud auszuliefern scheint nun sein Ziel.

[mit Material von Andrew Brust, ZDNet.com]

Tipp: Was haben Sie über Datenbanken gespeichert? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Neueste Kommentare 

Noch keine Kommentare zu IBM macht Apache Spark als Cloud-Service verfügbar

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *