Categories: Cloud

IBM macht Apache Spark als Cloud-Service verfügbar

IBM hat ein Angebot von Apache Spark-as-a-Service eingeführt. Der Dienst ist Teil der Bluemix-Cloud und lässt sich mit anderen Daten- und Analysediensten kombinieren, darunter Cloudant noSQL und der Data-Warehouse-Dienst dashDB.

Die Ankündigung erfolgte jetzt bei seiner Konferenz IBM Insight in Las Vegas. IBM hatte aber schon im Juni auf dem Spark Summit angekündigt, Spark zu unterstützen und 300 Millionen Dollar zu investieren. Es wollte auch ein Spark Technology Center in San Francisco gründen und 3500 Forscher für Spark abstellen.

IBM Analytics on Apache Spark wird auch Python-basierte Code-Notizbücher unterstützen – eine Funktion, die sich in Databricks Cloud-Spark-Plattform ebenfalls findet.

Parallel stellt IBM die so genannten Insight Cloud Services vor, die „externe Daten über Menschen, Veranstaltungen, Orte und Firmen aus Quellen wie Twitter und The Weather Company“ bereitstellen, wie es in der Presseerklärung heißt – also Daten, die beim Einsatz von Analytics die internen Daten des Kunden um Kontext anreichern können, um sie anschließend mit Spark auszuwerten.

ANZEIGE

MobileIron: Sichere Verwaltung von Android-Geräten

In vielen Unternehmen nutzen Mitarbeiter ihre privaten mobilen Geräte. Unternehmen, die dieser Szenario erlauben, sollten sich Gedanken über eine leistungsfähige Enterprise Mobility Management Suite machen. Nur damit lassen sich Unternehmensdaten gegen nicht autorisierten Zugriff absichern.

Der frühere Cloudant-CEO Derek Schoettle – und seit dessen Übernahme durch IBM General Manager of Cloud Data Services (CDS) – kommentierte gegenüber ZDNet.com, Spark sei nicht nur eine parallele Big-Data-Verarbeitungsplattform, sondern auch eine, die Maschinelles Lernen, Graph-Engine-Analysen und Streaming-Data-Verarbeitung einschließe. IBM sehe Spark daher als umfassende Umgebung, um mit Daten zu arbeiten.

Aus diesem Grund habe IBM rund 15 seiner eigenen Handels- und Analytics-Produkte auf Spark umgestellt. DataWorks beispielsweise habe auf diese Weise von 40 Millionen auf 5 Millionen Zeilen Quellcode reduziert werden können.

Mit DB2, Watson, Netezza, Cognos, TM1, SPSS, DataStage, Informix, Cloudant und der Hadoop-Distribution BigInsights dürfte IBM ohnehin schon das größte Angebot der Branche rund um Daten und Analytics haben – ein Portfolio, das über Jahrzehnte gewachsen ist. Diese Dienste rund um Apache Spark zu föderieren und per Cloud auszuliefern scheint nun sein Ziel.

[mit Material von Andrew Brust, ZDNet.com]

Tipp: Was haben Sie über Datenbanken gespeichert? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Studie: 91 Prozent der Ransomware-Opfer zahlen Lösegeld

Die durchschnittliche Lösegeldzahlung liegt bei 2,5 Millionen Dollar. Acht Prozent der Befragten zählten 2023 mehr…

12 Stunden ago

DMA: EU stuft auch Apples iPadOS als Gatekeeper ein

Eine neue Analyse der EU-Kommission sieht vor allem eine hohe Verbreitung von iPadOS bei Business-Nutzern.…

13 Stunden ago

Chips bescheren Samsung deutlichen Gewinnzuwachs

Das operative Ergebnis wächst um fast 6 Billionen Won auf 6,64 Billionen Won. Die Gewinne…

21 Stunden ago

Chrome: Google verschiebt das Aus für Drittanbietercookies

Ab Werk blockiert Chrome Cookies von Dritten nun frühestens ab Anfang 2025. Unter anderem gibt…

2 Tagen ago

BAUMLINK: Wir sind Partner und Aussteller bei der Frankfurt Tech Show 2024

Die Vorfreude steigt, denn BAUMLINK wird als Partner und Aussteller bei der Tech Show 2024…

2 Tagen ago

Business GPT: Generative KI für den Unternehmenseinsatz

Nutzung einer unternehmenseigenen GPT-Umgebung für sicheren und datenschutzkonformen Zugriff.

2 Tagen ago