Categories: CloudCloud-Management

Open Source: Datenbank-Managementsysteme und Plattformen greifen ineinander

Open Source ist längst seiner Rolle als Underdog entwachsen. Es sind nicht mehr nur experimentierfreudige Entwickler-Communities, die sich mit dem öffentlich einsehbaren Quellcode befassen. Über die letzten Jahrzehnte hat sich Open Source zu einer Bewegung der kollektiven Problemlösung entwickelt und viele große Unternehmen setzen ganz bewusst auf flexibel anpassbare und frei verfügbare Lösungen – beispielsweise bei Datenbanken. Zwei bewährte relationale Open-Source-Datenbanken sind MySQL und MariaDB, die bestimmte Unterschiede bei der Performance, Hochverfügbarkeit und Sicherheit aufweisen. Eingebunden in eine Datenplattform, stellen sie an einer zentralen Stelle Informationen über Abteilungsgrenzen hinweg zur Verfügung, um Mitarbeitern ihre Aufgaben zu erleichtern.

Von MySQL zu MariaDB
MySQL bildet die Ausgangsbasis für die Entwicklung von MariaDB. Diese hat sich von MySQL 5 abgespalten und zu einem eigenständigen Datenbank-Managementsystem entwickelt. Somit ist MariaDB ein Fork von MySQL. Aufgrund der langen Historie von MySQL ist dessen Entwickler-Community vergleichsweise groß. Unternehmen mit MySQL im Einsatz stehen daher umfangreiche Community-Ressourcen zur Verfügung. Sollten sich etwa im Betrieb der Lösung Probleme ergeben, profitieren Nutzer von einem im Netz erreichbaren gesammelten Expertenwissen. Während die Basis-Version von MySQL kostenlos ist, werden für Enterprise-Features Gebühren fällig. Um Features auf Enterprise-Level zu nutzen, sind Mitarbeiter mit entsprechendem IT-Know-how nötig.

MariaDB mit starker Performance
Die Performance von Datenbanken hat im Unternehmenseinsatz meist direkten Einfluss auf die Geschäftsprozesse. Gleichzeitig ist sie im Fall von MySQL und MariaDB ein wesentliches Unterscheidungsmerkmal. Allerdings ist nicht gesagt, dass eine Datenbank mit hoher Performance automatisch für jeden Betrieb die beste Wahl ist. Anwender sollten sich daher vor allem darauf konzentrieren, welche Möglichkeiten das jeweilige Datenbank-Managementsystem bietet, um es für den jeweiligen Anwendungsfall anzupassen. MariaDB punktet beispielsweise nicht nur mit einer großen Auswahl alternativer Datenbank-Engines, sondern bietet auch einen effizienten Optimizer für SQL-Abfragen. Ab Version 10.0.1 setzt MariaDB bei der Optimierung von Abfragen nicht mehr auf interne Statistiken der jeweiligen Datenbank-Engine, sondern auf Engine-unabhängige Tabellen-Statistiken. Diese werden als herkömmliche Tabellen in der Datenbank gespeichert und ermöglichen es, deutlich mehr Werte zu erfassen und auszuwerten, um einen idealen Plan für die Ausführung von SQL-Statements zu ermitteln. Wer auf der Suche nach einer hochleistungsfähigen relationalen Datenbanklösung ist, der wird bei MariaDB fündig.

Cluster-Lösungen für Hochverfügbarkeit

Sowohl MySQL als auch MariaDB eigenen sich für Szenarien mit verteilten Datenbanken. Um Anwendern hochverfügbare Systeme mit linearer Skalierbarkeit anbieten zu können, stellen beide Software-Projekte Cluster-Lösungen zur Verfügung: Bei der Lösung MySQL Cluster handelt es sich um eine ACID-konforme Echtzeit-Transaktionsdatenbank, die durch eine Multi-Master-Architektur ohne Single Point of Failure eine Verfügbarkeit von 99,9999% erreicht. Die Datenbank kann auf Standard-Hardware horizontal skaliert werden und bietet eine Auto-Sharing-Funktion für lese- und schreibintensive Workloads. Der Datenzugriff erfolgt je nach Bedarf über SQL- oder NoSQL-Schnittstellen. MariaDB setzt bei verteilten Datenbanken auf die Cluster-Software Galera der finnischen Softwarefirma Codership. Eine entsprechende Schnittstelle ist ab MariaDB 10.1 standardmäßig integriert. Auch hier liegt eine Multi-Master-Architektur zugrunde. Mit MaxScale steht eine spezielle Erweiterung für das Datenbank-Managementsystem zur Verfügung, die Anwendern diverse Zusatzfunktionen für das Routing in verteilten Systemen bietet. So lassen sich Datenbankzugriffe weiterleiten und bei Bedarf den Erfordernissen entsprechend modifizieren. MaxScale maskiert und schützt sensible Daten, blockt Anfragen gemäß zuvor konfigurierter Regeln ab, schützt vor Denial of Service (DoS), leitet automatisch Failover-Strategien ein und erhöht die Performance der Datenbank durch Caching und Read-Write-Splitting, also die Umleitung von Lese- und Schreibzugriffe auf verschiedene Datenbank-Instanzen.

Ausdifferenzierte Sicherheitsfeatures

Zu den zentralen Sicherheitsfunktionen eines Datenbank-Managementsystems zählen Verschlüsselung, Authentifizierung und Benutzerrollen. Sowohl MySQL als auch MariaDB unterstützen SSL-verschlüsselte Verbindungen. Beide Datenbanken bieten Verschlüsselungsfunktionen für inaktive Daten (Data at rest). MySQL setzt eine Verschlüsselung der in der Datenbank gespeicherten Daten mithilfe der Datenbank-Engine InnoDB auf Tablespace-Ebene um. Eine Verschlüsselung einzelner Datenbanktabellen ist nicht möglich. MariaDB hingegen bietet seit Version 10.1 deutlich differenziertere Verschlüsselungsfunktionen. Diese umfassen eine Data-at-rest-Verschlüsselung auf verschiedenen Datenbank-Ebenen wie InnoDB-Tabellenräume, InnoDB-Tabellen, InnoDB-Log-Dateien, Aria-Tabellen, temporäre Dateien und binäre Logdaten. Mit Rolling Encryption Keys bietet MariaDB zudem eine Funktion, ein Ablaufdatum für Verschlüsselungsschlüssel festzulegen. Bei der Benutzer-Authentifizierung kommt bei beiden Systemen ein Plugin-System zum Einsatz. Alleinstellungsmerkmal von MariaDB im Bereich Datenbanksicherheit ist die rollenbasierte Zugriffskontrolle (Role Based Access Control, RBAC), die seit Version 10.0.5 nativ ins DBMS implementiert ist, die Verwaltung von Zugriffsrechten deutlich vereinfacht und Fehler bei der manuellen Rechtevergabe reduziert. Ein ähnliches Feature sucht man bei MySQL bisher vergeblich.

Dezentral abgelegte Informationen zentral analysieren mit Cloud-Datenplattformen

Eine Cloud-Datenplattform kann auf Daten unterschiedlicher Quellen wie S3-Buckets, IoT-Geräte oder Datenbanken wie MySQL und MariaDB zugreifen, diese zusammenführen und zur weiteren Verarbeitung zur Verfügung stellen. Dadurch sind Mitarbeiter in der Lage, konsolidierte Datenbestände zu nutzen, die beispielsweise für Aufgaben in den Bereichen Business Intelligence und Predictive Analytics die Grundlage bilden. Apache Hadoop etwa ist eine Open-Source-Plattform, die für die Analyse großer Datenmengen gut geeignet ist. Sie ist dazu in der Lage, strukturierte und unstrukturierte Daten aus heterogenen Quellen zu beziehen, zueinander in Relation zu setzen und eine einfache Interpretation dieser großen Daten zu ermöglichen. Dadurch lassen sich Geschäftsentscheidungen datenbasiert stützen und neue Erfolgspotenziale ermitteln. Unternehmen, die auf Basis der Analysen Schlussfolgerungen für die Zukunft ableiten können, haben gute Chancen, sich von der Konkurrenz abzuheben. Möchte ein Unternehmen etwa zukünftige Absatzzahlen berechnen, müssen Daten aus verschiedenen Abteilungen zusammenfließen: Das Marketing gibt Auskunft, wie es um die Kaufbereitschaft der potenziellen Kunden steht, der Einkauf liefert Daten zur Beschaffungslage von Vorprodukten und Rohstoffen, aus dem Controlling kommen Informationen zum Cashflow und die Personalabteilung stellt in Aussicht, wie sich die Anzahl der Mitarbeiter in der Produktion entwickelt. All diese Daten lassen sich auf einer Plattform wie Hadoop zentral miteinander verrechnen.

Fazit:

Die Zahl an Open-Source-Datenbanken ist mittlerweile stark gewachsen. MySQL und MariaDB stellen zwei prominente Vertreter und solide Alternativen dar. Unternehmen sind gut beraten, ihre eigenen Anforderungen an die Leistungsstärke der Datenbank und das IT-Know-how der Mitarbeiter genau zu identifizieren, um die richtige Datenbank auszuwählen. Die Möglichkeiten zur Datenverarbeitung auf der Plattform sind mannigfaltig. Präskriptive Analysen sind nur ein Beispiel von vielen. Jedes Unternehmen kann unabhängig von Größe und Branche Datenbanken zur Ablage von Informationen nutzen und die Daten den Mitarbeitern auf einer Plattform zur abteilungsübergreifenden Nutzung zur Verfügung stellen.

Jakob Jung

Recent Posts

Logitech: Designed for Mac

Logitech startet eine Produktreihe von Mäusen und Tastaturen, die speziell für Apple-Rechner ausgelegt sind unter…

4 Stunden ago

Microsoft Ignite: Spotlight on Germany

Die Microsoft Konferenz Ignite findet in diesem Jahr vom 12. bis 14. Oktober 2022 statt.…

4 Stunden ago

Open Source Initiative weitet ihre Rolle aus

In den letzten 20 Jahren war die Open Source Initiative (OSI) die Hüterin der Open-Source-Lizenzen.…

5 Stunden ago

Intel stellt sich neu auf

Der Chiphersteller Intel setzt seinen Fokus auf neue KI-/ML-Anwendungen, weltweit verteilte Fabriken und eine überarbeitete…

5 Stunden ago

Serverausfall führt zu Insolvenz

Unternehmen sind durch Ausfälle verwundbar. Hybride Infrastrukturen machen den früheren Anker Rechenzentrum überflüssig, betont Andreas…

22 Stunden ago

SSD fördert Green IT

Ökologische Fragen, Lieferkettenprobleme und Energiekosten erfordern Green IT. Bei Storage gibt es Möglichkeiten zum Energiesparen,…

23 Stunden ago